Как сделать семантическую сеть
Историческая справка. Реляционные графы. Графы с центром в глаголе. Пропозиционные сети. Иерархия типов. Синтаксический анализ языка и его порождение. Обучение машин. Примение на практике.
Введение
Семантическая сеть - структура для представления знаний в виде узлов, соединенных дугами. Самые первые семантические сети были разработаны в качестве языка-посредника для систем машинного перевода, а многие современные версии до сих пор сходны по своим характеристикам с естественным языком. Однако последние версии семантических сетей стали более мощными и гибкими и составляют конкуренцию фреймовым системам, логическому программированию и другим языкам представления.
- узлы семантических сетей представляют собой концепты предметов, событий, состояний;
- различные узлы одного концепта относятся к различным значениям, если они не помечено, что они относятся к одному концепту;
- дуги семантических сетей создают отношения между узлами-концептами (пометки над дугами указывают на тип отношения);
- некоторые отношения между концептами представляют собой лингвистические падежи, такие как агент, объект, реципиент и инструмент (другие означают временные, пространственные, логические отношения и отношения между отдельными предложениями;
- концепты организованы по уровням в соответствии со степенью обобщенности так как, например, сущность, живое существо, животное, плотоядное.
Однако существуют и различия: понятие значения с точки зрения философии; методы представления кванторов общности и существования и логических операторов; способы манипулирования сетями и правила вывода, терминология. Все это варьируется от автора к автору. Несмотря не некоторые различия, сети удобны для чтения и обработки компьютером, а также достаточно мощны, чтобы представить семантику естественного языка.
Историческая справка
Фрег представил логические формулы в виде деревьев, которые однако мало напоминают современные семантические сети. Еще одним пионером стал Чарльз Сандерз Прис, который использовал графические записи в органической химии.
Он сформулировал правила выводы с использованием экзистенциональных графов.
В психологии Зельц использовал графы для представления наследственности некоторых характеристик в иерархии концептов. Научные изыскания Зельца имели огромное влияние на изучение тактики в шахматах, который в свою очередь повлиял на таких теоретиков, как Саймон и Ньюэлл.
Что касается лингвистики, то первым ученым, занимавшимся разработкой графических описаний, стал Теньер. Он использовал графическую запись для своей грамматики зависимостей. Теньер оказал огромное влияние на развитие лингвистики в Европе.
Впервые семантические сети были использованы в системах машинного перевода в конце 50-х - начале 60-х годов. Первая такая система, которую создала Мастерман, включала в себя 100 примитивных концептов таких, как, например, НАРОД, ВЕЩЬ, ДЕЛАТЬ, БЫТЬ. С помощью этих концептов она описала словарь объемом 15000 единиц, в котором также имелся механизм переноса характеристик с гипертипа на подтип. Некоторые системы машинного перевода базировались на корреляционных сетях Цеккато, которые представляли собой набор 56 различных отношений, некоторые из которых - падежные отношения, отношения подтипа, члена, части и целого. Он использовал сети, состоящие из концептов и отношений для руководства действиями парсера и разрешения неоднозначностей.
В системах искусственного интеллекта семантические сети используются для ответа на различные вопросы, изучение процессов обучения, запоминания и рассуждений. В конце 70-х сети получили широкое распространение. В 80-х годах границы между сетями, фреймовыми структурами и линейными формами записи постепенно стирались. Выразительная сила больше не является решающим аргументом в пользу выбора сетей или линейных форм записи, поскольку идеи записанные с помощью одной формы записи могут быть легко переведены в другую. И наоборот, особо важное значение получили второстепенные факторы, как читаемость, эффективность, неискусственность и теоретическая элегантность, также учитываются легкость введения в компьютер, редактирование и распечатка.
Реляционные графы
Самые простые сети, которые используются в системах искусственного интеллекта, - реляционные графы. Они состоят из узлов, соединенных дугами. Каждый узел представляет собой понятие, а каждая дуга - отношения между различными понятиями. На рисунке 1 представлено предложение "Собака жадно гложет кость". Четыре прямоугольника представляют понятия собаки, процесса гложения, кости и такой характеристики, как жадность. Надписи над дугами означают, что собака является агентов гложения, кость является объектом гложения, а жадность - это манера гложения.
Терминология, использующаяся в этой области различна. Чтобы добиться некоторой однородности, узлы, соединенные дугами, принято называть графами, а структуру, где имеется целое гнездо из узлов или где существуют отношения различного порядка между графами, называется сетью. Помимо терминологии, использующейся для пояснения, также различаются способы изображения. Некоторые используют кружки вместо прямоугольников; некоторые пишут типы отношений прямо над дугами, не заключая их в овалы; некоторые используют аббревиатуры, например О или А для обозначения агента или объекта; некоторые используют различные типы стрелок. На рисунке 2 изображен граф концептуальных зависимостей Шенка. означает агента. INGEST (поглощать) - один из примитивов Шенка: ЕСТЬ - ПОГЛОЩАТЬ твердый объект; ПИТЬ - ПОГЛОЩАТЬ жидкий объект; ДЫШАТЬ - ПОГЛОЩАТЬ газообразный объект. Дополнительная стекла слева показывает, что кость переход из неуказанного места к собаке.
Поскольку довольно сложно ввести в компьютер некоторые диаграммы и при этом они занимают много места при печати, многие ученые записывают свои графы в более компактном варианте. Например, то же предложение Сова предложил записать в линейном виде с использованием некоторых элементов из рисунка 1:
[ЕСТЬ]-
(AGNT) -> [СОБАКА] |
(OBJ) -> [КОСТЬ] |
(MANR) -> [ЖАДНОСТЬ] |
В этом варианте записи квадратные скобки обозначают понятия, а круглые скобки содержат в себе названия отношений. Все линейные формы записи очень похожи на фреймовые структуры.
Графы с центром в глаголе
Глаголы соединяются с группой существительного с использованием падежных отношений. Например, с предложении "Mary gave a book to Fred", Mary агент давания, book объект этого процесса, а Fred реципиент глагола "давать". Помимо падежных отношений в предложении в естественном языке также имеются средства для связи отдельных предложений. Такие отношения необходимы для следующего:
Союзы. Самый простой способ соединить предложения - это поставить между ними союз. Некоторые союзы, как например "и", "или", "если" обозначают логическую связь; некоторые, такие как "после того, как", "когда", "пока", "с тех пор, как" и "потому что", выражают временные отношения и причину.
Глаголы, требующие подчиненное предложение. Падежные фреймы многих глаголов требуют подчиненного предложения, являющегося обычно прямым дополнением. К такому типу относятся глаголы "говорить", "считать", "думать", "знать", "быть убежденным", "угрожать", "пытаться" и др.
Определители, относящиеся к целому предложению. Многие наречия и пропозиционные фразы относятся только к глаголу, но некоторые определяют целое предложение. Такие наречия, как "обычно", "вероятно", в большинстве случаев ставятся в начале предложения. А например, слово "однажды" определяет весь рассказ, следующий после него.
Модальные глаголы и времена. Такие глаголы, как "may", "can", "must", "should", "would" и "could" имеют модальное значение и относятся ко всему предложению, где они встречаются. Временное отношение может быть выражено как формой прошедшего времени глаголов, так и обстоятельствами "сейчас", "завтра" или "однажды" и другими.
Связанный дискурс. Помимо отношений, выраженных в одном предложении, существуют также отношения более высокого порядка между отдельными предложениями рассказа или какого-либо другого повествования. Многие из них не выражены эксплицитно: временные отношения и следование аргументов может быть, например, имплицитно выражено порядком следования предложения друг за другом в тексте.
Именно потому, что глагол отводится такая важная роль в предложении, многие теория делают его своим центральным связующим звеном. Этот подход берет свое начало из Индо-Европейской языковой семьи, где модальность и временные отношения выражаются изменением глагольной формы. Рассмотрим следующий пример: "While a dog was eating a bone, a cat passed by unnoticed". В этом предложении сообщено, что, когда предложение "While a dog was eating a bone" являлось истинным, второе предложение "A cat passed unnoticed" также является истинным. На рисунке 3 изображен граф с центром в глаголе. Союз "while" (WHL) соединяет узел PASS-BY с узлом EAT. На рисунке 3 показано, что собака является агентом незамечания (not noticing).
Графы с центром в глаголе - это реляционные графы, где глагол считается центральным звеном любого предложения. Маркеры времени и отношения пишутся прямо рядом с концептами, которые представляют глаголы. Графы концептуальных зависимостей Роджера Шенка также используют этот подход.
Несмотря на то, что графы с центром в глаголе довольно гибкие по своей структуре, они обладают рядом ограничений. Одно из них заключается в том, что они не проводят разграничение между определителями, которые относятся только к глаголу, и определителями, относящимися к предложению целиком. Рассмотрим следующие примеры:
The dog greedily ate the bone.
Greedily, the dog ate the bone.
Эти графы также плохо справляются с предложениями, находящимися внутри других предложений.
При работе с реляционными графами возникают проблемы с передачей всего многообразия временных отношений и отношений модальности. Несмотря на то, что многие учение используют эти графы для решения сложных проблем, они так до сих пор и не разработали общего метода для их разрешения. В выше приведенном примере пометка PAST должна относится ко всему предложению, которое говорит о том, что собака ест кость, а не только к глаголу EAT, поскольку очевидно, что кость позже была съедена собакой целиком. Также должно быть указано, что процесс прохождения кошки и процесс не замечания ее собакой происходили в одно и то же время.
Пропозиционные сети
В пропозиционных сетях узлы представляют целые предложения. Эти узлы являются точками соприкосновения для отношений между отдельными предложениями связанного текста. С другой стороны они определяют время и модальность для всего контекста. Представленные ниже примеры иллюстрируют отношения, для записи которых необходимы пропозиционные узлы:
Sue thinks that Bob believes that a dog is eating a bone.
If a dog is eating a bone, it is unwise to try to take it away from him.
В первом предложении для глаголов "think" и "believe" целое предложение является дополнением: Боб считает, что "А dog is eating a bone", то, что думает Сью представляет собой более сложное предложение-"Bob believes that a dog is eating a bone". Такое гнездование предложений внутри других предложений может повторятся сколь угодно большое количество раз. Чтобы изобразить такое предложение, необходимо использовать пропозиционные узлы, которые содержат гнездящиеся графы. На рисунке 4 изображена пропозиционная сеть для этого предложения. Отметим, что (EXP) - experiencer, то есть тот кто испытывает, соединяет THINK с Сью, а BELIEVE с Бобом, однако EAT и DOG соединены между собой агентивным отношением (AGNT). Причиной разного типа отношений является тот факт, что думать и считать-это состояния, испытываемые людьми, а поедание-это действие осуществляемое агентом.
Во втором примере представлены два предложения, находящиеся в отношении условия. Антецедентом является предложение "А dog is eating a bone", а консеквентом предложение "It is unwise to try to take it away from him". Инфинитивы "to try" и "to take" указывают на другие, гнездящиеся предложения. На гнездящиеся предложения также указывает оборот "it is unwise". Для этого предложения также необходимо указать соответствие между "it", "him" и "bone" и "dog". Связи соответствия обозначены пунктиром. Для формальной записи этого предложения также используются кванторы общности и существования и некоторые элементы логики.
- Включение контекста или всего лишь его условное обозначение с отсылкой на схеме.
- Строгое гнездование: один и тот же концепт может или не может встречаться в двух разных контекстах, ни один из которых не гнездиться в другом.
- Указание связей соответствия. При перекрещивающемся контексте, то есть когда они один и тот же концепт встречается в двух разных контекстах, эти связи не указываются.
Однако это всего лишь стилистические расхождения, которые не влияют существенно на логику построения.
Иерархия типов
Иерархия типов и подтипов является стандартной характеристикой семантических сетей. Иерархия может включать сущности: ТАКСА Источник: Рефераты ИИ от Prof
E-mail
© Prof 2003-2004
08.02.2004
2/2
Семанти́ческая сеть — информационная модель предметной области, имеющая вид ориентированного графа, вершины которого соответствуют объектам предметной области, а дуги (рёбра) задают отношения между ними. Объектами могут быть понятия, события, свойства, процессы [1] . Таким образом, семантическая сеть является одним из способов представления знаний. В названии соединены термины из двух наук: семантика в языкознании изучает смысл единиц языка, а сеть в математике представляет собой разновидность графа — набора вершин, соединённых дугами (рёбрами), которым присвоено некоторое число. В семантической сети роль вершин выполняют понятия базы знаний, а дуги (причем направленные) задают отношения между ними. Таким образом, семантическая сеть отражает семантику предметной области в виде понятий и отношений.
Содержание
История
Важным направлением в исследовании сетей стали работы немецкого психолога Отто Зельца 1913 и 1922 гг. В них для организации структур понятий и ассоциаций, а также изучения методов наследования свойств он использовал графы и семантические отношения. Исследователи Дж. Андерсон (1973), Д. Норман (1975) и другие использовали эти работы для моделирования человеческой памяти и интеллектуальных свойств.
Компьютерные семантические сети были детально разработаны Ричардом Риченсом в 1956 году в рамках проекта Кембриджского центра изучения языка по машинному переводу. Процесс машинного перевода подразделяется на 2 части: перевод исходного текста в промежуточную форму представления, а затем эта промежуточная форма транслируется на нужный язык. Такой промежуточной формой как раз и были семантические сети. В 1961 г. появилась работа Мастермана, в которой он, в частности, определял базовый словарь для 15000 понятий. Эти исследования были продолжены Робертом Симмонсом (1966), Уилксом (1972) и другими учёными.
Труды по семантическим сетям часто ссылаются на работу американского психолога Росса Квиллиана (Quillian) о "семантической памяти" [2] .
Структура
Математика позволяет описать большинство явлений в окружающем мире в виде логических высказываний. Семантические сети возникли как попытка визуализации математических формул. Основным представлением для семантической сети является граф. Однако не стоит забывать, что за графическим изображением непременно стоит строгая математическая запись, и что обе эти формы являются не конкурирующими, а взаимодополняющими.
Графическое представление
Основной формой представления семантической сети является граф. Понятия семантической сети записываются в овалах или прямоугольниках и соединяются стрелками с подписями — дугами (см. рис.). Это наиболее удобно воспринимаемая человеком форма. [источник не указан 337 дней] Её недостатки проявляются, когда мы начинаем строить более сложные сети или пытаемся учесть особенности естественного языка. Схемы семантических сетей, на которых указаны направления навигационных отношений, называют картами знаний, а их совокупность, позволяющая охватить большие участки семантической сети, атласом знания.
Математическая запись
В математике граф представляется множеством вершин V и множеством отношений между ними E. Используя аппарат математической логики, приходим к выводу, что каждая вершина соответствует элементу предметного множества, а дуга — предикату.
Лингвистическая запись
В лингвистике отношения фиксируются в словарях и в тезаурусах. В словарях в определениях через род и видовое отличие родовое понятие занимает определённое место. В тезаурусах в статье каждого термина могут быть указаны все возможные его связи с другими родственными по теме терминами. От таких тезаурусов необходимо отличать тезаурусы информационно- поисковые с перечнями ключевых слов в статьях, которые предназначены для работы дескрипторных поисковых систем.
Классификация семантических сетей
Для всех семантических сетей справедливо разделение по арности и количеству типов отношений.
- По количеству типов отношений, сети могут быть однородными и неоднородными.
- Однородные сети обладают только одним типом отношений (стрелок), например, таковой является вышеупомянутая классификация биологических видов (с единственным отношением AKO).
- В неоднородных сетях количество типов отношений больше двух. Классические иллюстрации данной модели представления знаний представляют именно такие сети. Неоднородные сети представляют больший интерес для практических целей, но и большую сложность для исследования. Неоднородные сети можно представлять как переплетение древовидных многослойных структур. Примером такой сети может быть Семантическая сеть Википедии.
- типичными являются сети с бинарными отношениями (связывающими ровно два понятия). Бинарные отношения очень просты и удобно изображаются на графе в виде стрелки между двух концептов. Кроме того, они играют исключительную роль в математике.
- На практике, однако, могут понадобиться отношения, связывающие более двух объектов — N-арные. При этом возникает сложность — как изобразить подобную связь на графе, чтобы не запутаться. Концептуальные графы (см. ниже) снимают это затруднение, представляя каждое отношение в виде отдельного узла.
- Для решения конкретных задач, например, тех которые решают системы искусственного интеллекта.
- Семантическая сеть отраслевого масштаба должна служить базой для создания конкретных систем, не претендуя на всеобщее значение.
- Глобальная семантическая сеть. Теоретически такая сеть должна существовать, поскольку всё в мире взаимосвязано. Возможно когда-нибудь такой сетью станет Всемирная паутина.
Помимо концептуальных графов существуют и другие модификации семантических сетей, это является ещё одной основой для классификации (по реализации). См. более подробно в соответствующем разделе ниже.
Семантические отношения
Количество типов отношений в семантической сети определяется её создателем, исходя из конкретных целей. В реальном мире их число стремится к бесконечности. Каждое отношение является, по сути, предикатом, простым или составным. Скорость работы с базой знаний зависит от того, насколько эффективно реализованы программы обработки нужных отношений.
Иерархические
Часто в семантических сетях требуется определить отношения синонимии и антонимии. Эти связи либо дублируются явно в самой сети, либо определяются алгоритмической составляющей.
Вспомогательные
В семантических сетях часто используются также следующие отношения [Гаврилова]:
Особенности использования некоторых типов отношений
Рассмотрим пример — четыре предложения:
- У Павла есть отец по имени Алексей.
- Для Павла найдётся отец из множества мужчин.
- Найдется человек, для которого Алексей — отец.
- У каждого человека есть отец из множества мужчин.
Для человека ясен смысл этих фраз и многие не задумываясь поставили бы во всех трёх случаях отношение есть отец. Однако это является ошибкой: в первом случае, действительно, описывается отношение между двумя экземплярами, но во втором и третьем — между экземпляром и множеством, а в четвёртом — отношение между представителями из двух множеств. В математической записи это выглядит так, соответственно для предложений 1—4:
Мы видим, что случаи IIа и IIб различаются только порядком следования переменных в предикате, однако для правильности сети это может сыграть важную роль. В примере перечислены лишь 4 рода отношений, всего же для бинарной сети их существует девять. Они различаются кванторами ∃ и ∀, а также порядком переменных.
Графически для отличия всех этих случаев применяют специальные форму пометок отношений на графе: например, отношения первого рода оставляют без изменений, второго — обводят прямоугольной рамкой из точек, третьего — тире, а четвёртого — тире-точка. Либо можно просто написать рядом индекс типа отношения.
Использование семантических сетей
Семантизация
Семантизация - процесс изменения текстов, в которых выделяются семантические отношения без изменения их содержания. В Википедии существуют проекты по семантизации статей и Дерева категорий.
- Семантизация статей производится, в основном, путём использования шаблонов, при этом некоторые категории создаются автоматически.
- Семантизация Дерева категорий заключается в соблюдении транзитивности, создании метакатегорий и организации структуры подкатегорий, используя значимые критерии.
Семантическая паутина
Концепция организации гипертекста напоминает однородную бинарную семантическую сеть, однако здесь есть существенное отличие:
Попытка создания семантической сети на основе Всемирной паутины получила название семантической паутины. Эта концепция подразумевает использование языка RDF (языка разметки на основе XML) и призвана придать ссылкам некий смысл, понятный компьютерным системам. Это позволит превратить Интернет в распределённую базу знаний глобального масштаба.
Семантическая сеть: пусть компьютеры понимают Интернет
В марте 1983 года Тим Бернерс-Ли, основатель Интернета, предложил диаграмму распределенной гипертекстовой системы. Все ссылки, содержащиеся в ней, содержат семантику. Эта диаграмма впервые предложила идею о том, что веб-информация содержит семантику. В мае 1994 года Тим Бернерс-Ли, первая международная конференция WWW, подчеркнул важность семантики в отчете конференции. В декабре 1997 года он указал в отчете W3C, что первая цель Интернета - стать средством общения людей посредством обмена знаниями, а вторая цель - стать средой для совместной работы людей, что проложило путь для семантической сети. В сентябре 1998 года Тим Бернерс-Ли предложил общую структуру Семантической паутины в литературе и дал обзор ее различных компонентов. В декабре 2000 года Тим Бернерс-Ли впервые предложил диаграмму иерархической структуры семантического веб-расширения, слой за уровнем, в отчете о конференции XML 2000, указав основу исследования семантического веба. В мае 2001 года Тим Бернерс-Ли систематически представил концепцию и связанные с ней технологии Семантической паутины в Scientific America.Пока можно сказать, что Семантическая паутина официально появилась. W3C - это текущая организация по стандартизации семантической паутины. Она играет руководящую роль в разработке и формулировании стандартов и спецификаций семантической паутины, а также в открытых и совместных исследованиях и разработках технологий, а также направляет и стандартизирует ключевые технологии для других сфер. централизованные исследования и разработки для обеспечения их согласованного развития.
Последняя иерархическая модель семантической паутины (также известная как стек протоколов) показана на прилагаемом рисунке.
Иерархическая структура развития семантической сети видна из рисунка. Первый уровень - это Unicode (Uniform Code) и URI (Uniform Resource Identifier, Uniform Resource Identifier), который является основой всей Семантической сети. Unicode занимается кодированием ресурсов, а URI отвечает за идентификацию ресурсов. Второй уровень - это XML, который используется для представления содержания и структуры данных. Третий уровень - это RDF (Resource Description Framework), который используется для описания ресурсов и их взаимосвязей. Четвертый уровень, RDF-S, обеспечивает механизм определения типа для RDF и определяет словарь предметной области, используемый ресурсами, описываемыми RDF. Пятый уровень - это онтология и правила. Онтологии используются для описания понятий предметной области и связей между концепциями; правила используются для описания предпосылок и выводов в знании предметной области; онтология и правила составляют уровень знания предметной области. SPARQL, оператор запроса, охватывающий четвертый и пятый уровни, предоставляет функции запроса для файлов OWL (язык веб-онтологий) и RIF (формат обмена правилами). Шестой уровень - это Unifying Logic, который выполняет логические операции рассуждений на основе следующих пяти уровней. Седьмой уровень - это проверка (Доказательство), которая проверяется на основе логических утверждений, чтобы сделать выводы. Восьмой уровень - это доверие, которое устанавливает доверительные отношения между пользователями. Девятый уровень - это уровень приложений, который представляет собой множество приложений, построенных на семантической сети. Вкратце, следующие два уровня представляют собой инфраструктуру семантической сети. Развитие от метаданных до языка описания онтологий и его унифицированной логики является ключевым исследованием семантической сети. Вышеупомянутая сертификация и доверие и технология цифровой подписи повсюду уровень Это расширение, требование и перспектива для успешного применения семантической сети.
Развитие и успех семантической паутины в основном зависит от разработки и успешного применения некоторых ключевых технологий, которые ее поддерживают. Основными технологиями семантической сети являются:
В настоящее время веб-контент организован таким образом, чтобы люди могли его понять, а не машины. Веб-язык - это в основном HTML. HTML отвечает только за отображение данных и не заботится о содержании данных. Метаданные - это данные о данных, и их роль заключается в описании содержимого Интернета таким образом, чтобы он мог быть обработан машиной. Например, заголовок статьи в сети помечается с помощью , автор статьи помечается с помощью , а содержание статьи помечается с помощью
- эта статья в Интернете. Метаданные статьи. В настоящее время XML является наиболее часто используемым языком представления метаданных. Он позволяет организациям и частным лицам создавать набор тегов (набор метаданных), который соответствует их потребностям, и эти теги можно быстро использовать.
Метаданные, выраженные в XML, могут быть созданы организациями и отдельными лицами. В сети одни и те же метаданные представляют разные значения, а разные метаданные представляют одно и то же значение. Семантическая сеть Web использует технологию онтологий для решения этой проблемы. Онтология - это четкая формальная спецификация общих понятий в предметной области.
Различные домены и приложения создают свою собственную онтологию на основе знаний предметной области, то есть используют язык описания онтологий для описания общих концепций и отношений между концепциями, чтобы эти концепции выражали четкую семантику.
Основные элементы онтологии включают концепции (также называемые классами), атрибуты, экземпляры, отношения и аксиомы. Понятие - это определение общего понятия. Атрибуты используются для описания свойств понятия. Экземпляры представляют собой конкретизацию понятия и представляют собой объекты, которые соответствуют атрибутам определенного понятия. Отношения используются для описания взаимосвязи между различными концепции. Аксиомы в области. правила.
Основываясь на развитии технологий, W3C предложил стек языка онтологий для семантической сети. Снизу вверх, это RDF, OIL (уровень вывода онтологии), DAML (язык разметки агента DARPA) и OWL. В настоящее время OWL является стандартом, рекомендованным W3C. Режим RDF RDL предоставляет словарь определений, который представляет собой структуру классификации.RDF-S ограничивает метаданные, описывающие ресурсы, тем самым расширяя выразительные возможности RDF. OIL - это расширение RDFS через определение типа документа XML для увеличения определения реализации грамматики, DAML - это расширение веб-онтологии, позволяющее использовать правила выражения языка. OWL - это текущий язык описания онтологий, рекомендованный организацией W3C.Его цель - предоставить язык для описания классов, встроенных в веб-документы и приложения, а также отношений между этими классами. По сравнению с XML и RDFS, OWL имеет больше механизмов для выражения семантики, тем самым превосходя способность XML и RDFS выражать только содержимое онлайн-машиночитаемых документов.
Исследование онтологий - долгосрочная проблема искусственного интеллекта. Среди них автоматическое построение онтологий, сопоставление различных онтологий и автоматическая эволюция онтологий были горячими точками исследований онтологий в последние годы, и они также являются горячими точками в семантическое веб-исследование.
Логика обеспечивает формальное представление знаний, а также механизм рассуждений для вывода неизвестных знаний из известных. Используя логические рассуждения, мы можем узнать неявные знания и неявные отношения в базе знаний, представленной онтологией, и судить, конфликтуют ли знания в онтологии друг с другом, и проверить согласованность онтологии. Логика описания является логической основой языка описания онтологий OWL, представляет собой разрешимое подмножество логики предикатов первого порядка, может предоставлять услуги разрешимого рассуждения и имеет семантические особенности. После более чем 20 лет исследований и разработок логика описания в основном стала зрелой и применяемой. Это формальный инструмент для представления знаний. Однако логика описания может иметь дело только со статическими знаниями и бессильна в представлении и рассуждении динамического мира, особенно представление внутренней базы знаний интеллектуального агента является слабым и не может описывать динамику и интерактивность сервисов. . Первоначально динамическая логика использовалась для проверки правильности программы. Позже люди также использовали ее для представления и рассуждений о динамическом мире, а некоторые также использовались при разработке логических программ. Они могут лучше изображать действия, состояния и динамические отношения, но они слабы в выражении статических знаний, и рассуждения более сложны. Как сочетать динамику со статикой - ключевой вопрос, который необходимо изучить.
Интеллектуальные агенты - важная технология для интеллектуального программного обеспечения в распределенной среде. Он был предложен с 1950-х годов, но реальное развитие произошло после 1980-х, которые стали кульминацией исследований в 1990-х годах, и до сих пор он остается горячей точкой в исследованиях искусственного интеллекта. Текущее исследование интеллектуальных агентов в основном сосредоточено на следующих аспектах: когнитивная модель и теория агента, архитектура многоагентной системы, сотрудничество и согласование агента, методология агентно-ориентированного программного обеспечения и применение агентская технология. После почти двух десятилетий исследований теория и технология предмета достигли значительного прогресса и нашли применение во многих областях. Для пользователей семантическая сеть Web должна предоставлять богатую и полную услугу, услугу, основанную на представлении знаний и рассуждениях, и эти услуги предоставляются интеллектуальными агентами.
Поисковые системы являются одним из основных приложений Интернета. Согласно отчету China Internet Report за 2007 год, три четверти людей, пользующихся Интернетом, пользуются поисковыми системами. Технология поисковой машины перешла от поиска по каталогу первого поколения к поиску на основе ключевых слов второго поколения и к развитию технологии поисковых машин третьего поколения. Что касается поисковой системы третьего поколения, разные исследователи имеют разные мнения и нет единого понимания, но все согласны с тем, что поисковая машина третьего поколения будет более или менее применять семантические механизмы для улучшения поискового эффекта и удовлетворенности пользователей. Следовательно, в определенной степени можно считать, что поисковая машина третьего поколения является поисковой машиной на основе семантики. Семантический поиск вернет пользователям более точные и полезные результаты поиска благодаря точному пониманию намерений пользователя и значения поискового контента, а также повысит точность и запоминаемость информации.
В семантическом поиске технология онтологии, механизм хранения информации, алгоритм поиска, обоснование знаний, языковая обработка и т. Д. - все это ключевые технологии, которые исследуются в семантическом поиске.
Веб-сервисы - это слабо связанные и многократно используемые программные модули. Его цель - обеспечить поддержку интеграции прикладного программного обеспечения между различными операционными системами, аппаратными платформами и языками программирования в Интернете, чтобы облегчить реализацию и выпуск приложений. По сравнению с другими технологиями распределенных вычислений, наиболее значительным преимуществом веб-служб является то, что любая веб-служба может взаимодействовать с любой другой веб-службой через стандартный протокол (SOAP). В то же время любой пользователь веб-службы может использовать стандартный веб-протокол. позвоните в веб-службу. Благодаря вышеперечисленным характеристикам исследования и применение веб-сервисов в последние годы быстро развивались и получили широкую поддержку со стороны крупных производителей, таких как IBM, Microsoft и Sun. Веб-сервисы имеют широкие перспективы применения в интеграции приложений, электронной коммерции и других областях.
Хотя у веб-сервисов есть много преимуществ, из-за большого количества сервисов и разделения разработчиков и пользователей сервисов автоматическое обнаружение, комбинирование, надзор и вызов сервисов стали трудными моментами в разработке систем приложений на основе сервисов. Семантика Веб-сервисы будут Комбинация технологии семантической паутины и технологии веб-сервисов направлена на описание веб-сервисов с помощью онтологии, чтобы компьютеры могли понимать содержание сервисов и на этой основе реализовывать автоматическое обнаружение, комбинирование и вызов сервисов.
Цель семантической паутины - улучшить сегодняшнюю сеть. Его основная идея - превратить семантическую информацию в объект, обрабатываемый компьютером. Его основные технологии в основном включают представление метаданных, онтологию, логические рассуждения и технологию интеллектуальных агентов. Развитие семантической паутины зависит от развития ее различных уровней технологий.
Предлагаемый текст: Текущая сеть использует гиперссылки для соединения документов, в то время как семантическая сеть Web использует семантические ссылки для соединения различных данных и ресурсов в сети, чтобы максимизировать потенциал данных и ресурсов в сети.Пропозициональная логика используется для манипулирования выражениями - предложениями человеческой речи, истинное или ложное значение которых может быть определено.
Начнем с определения понятия семантических сетей. Высказывания имеют форму декларативных знаний, поскольку в них утверждаются факты. С точки зрения математики, семантическая сеть является замеченным ориентированным графом.
При этом, выражение всегда считается атомарным, поскольку его истинное значение не подлежит дальнейшей декомпозиции.
Семантические сети впервые были разработаны для исследований в области искусственного интеллекта как способ описания человеческой памяти Квиллианом (Quillian) в 1968 году. Квиллиан использовал семантические сети для анализа значения слов в предложениях.
В последующие времена семантические сети успешно применялись для решения многих задач, связанных с представлением знаний. Их ценность заключается в возможности учитывать в базе знаний, кроме форм утверждений, их семантику.
Такие знания позволяют экспертным системам дойти приемлемого логического вывода при работе с неоднозначными фактами.
Структура семантической сети
Структура семантической сети отображается графически с помощью узлов и дуг, соединяющих их. Узлы называются объектами, а дуги - связями или ребрами. Связи в семантической сети применяются для представления отношений, а узлы, как правило для представления физических объектов, концепций или ситуаций.
В качестве примера можно привести семантическую сеть на рис. 1., Связи которой, определяющие отношения между членами семьи: Рисунок 1- Семантическая сеть родственных связей
Для семантических сетей отношения имеют особо важное значение, поскольку образуют базовую структуру для организации знаний. Знания, заданные без учета отношений, превращаются просто в коллекцию несвязанных фактов.
Семантические сети иногда называют ассоциативными сетями, так узлы таких сетей связаны, то есть ассоциированные между собой. В научных исследованиях Квиллиана, человеческая память от начала моделировалась как ассоциативная сеть, в которой понятия были представлены в виде узлов, а связи показывали, как эти понятия сочетаются друг с другом.
Согласно указанному моделью, если происходит стимуляция одного узла, как в результате чтения слов в предложении, то идет активизация связей этого узла с другими узлами. В дальнейшем эта активность распространяется по сети. Как только узел получает достаточное активизацию, в сознательном уме возникает концепция, представленная этим узлом.
Например, известно, что человек знает тысячи слов, но в процессе чтения предложения, в ее сознании отражаются только те слова, которые оно читает. Как показала практика, во многих способах представления знаний, особенно полезным является применение отношений одинаковых типов.
Поэтому, при построении семантических сетей для представления знаний в различных предметных областях, вместо того, чтобы каждый раз определять новые отношения, принято использовать именно стандартизированные типы.
Связи в семантических сетях
Примером такого типа связей может быть отнесения клиентов банковских учреждений к определенному классу, изображенные на рис. 2. Связь IS-A используется для обозначения отношений между отдельными объектами через принадлежность их к общему класса благодаря тождественности атрибутов. Рисунок 2- Связь типа IS-A в семантической сети
Другим, широко используемым типом связи является тип A-KIND-OF (записывается как АКО). В отличие от связи IS-A, которая определяет отношения между отдельными объектами и родовыми классами, связь АКО определяет отношение между самыми родовыми классами (рис 3).
Следует отметить, что общий класс, на который указывает стрелка АКО, называется суперклассом. В случае, если суперкласс имеет связь АКО, что указывает на другой узел, то он, вместе с тем, является классом суперкласса. Рисунок 3 - Связи типа АКО и IS-A в семантической сети
Повторение характеристик узла в его потомках называется наследованием. Если нет доказательств, позволяющих утверждать обратное, то считается, что все элементы некоторого класса наследуют все свойства суперклассов этого класса.
Связи и наследование является основой эффективных способов представления знаний, поскольку дают возможность представлять значительное количество сложных отношений с помощью нескольких узлов и связей. В семантических сетях используются также связи других типов.
В частности, к ним относится связь CAUSE, выражающий причинные знания. Например, горячий воздух CAUSE (становится причиной) того, что воздушный шар поднимается вверх.
Еще одним важным связью семантических сетей является связь HAS-A, устанавливающий отношения между классом и подклассом. Направленность связи HAS-A противоположная по отношению к связи АКО. Этот тип часто используется для обозначения отношения между одним объектом и его составной частью, например:
банк HAS-A бухгалтерию банк IS-A Райффайзен
То есть, можно сказать, что если связь IS-A устанавливает отношения между значением и атрибутом, то связь HAS-A - между объектом и атрибутом.
Все объекты одного класса должны иметь один или несколько общих атрибутов. Комбинация атрибута и значение называется свойством. Следующие три понятия, как объект, атрибут и значения, встречаются вместе настолько часто, что появляется возможность создать упрощенную семантическую сеть с использованием только этих понятий.
Читайте также: