Тезаурусы, управляемые словари и метаданные

Метаданные

Определение метаданным дать довольно сложно, но в общем случае их можно назвать описательными данными, в которых содержится информация о других данных, с которыми производятся какие-либо действия в среде или приложении. Метаданные могут содержать в себе характеристики данных, информацию об их контексте, состоянии или качестве.

С помощью метаданных описывают аудио- и видеофайлы, графику, программы и приложения, а также любые другие элементы страницы сайта. Теги метаданных не видны в интерфейсе, но доступны поисковым механизмам и упрощают переходы по ссылкам или извлечение данных.

Управляемые словари и тезариусы

Под управляемым словарем понимают любое подмножество естественного языка. В общем случае словарь представляет собой список эквивалентных или предпочтительных терминов, записанных в нормативном файле. Если установить между терминами иерархические отношения, то получится схема классификации, а если добавить ассоциативные связи, то получится тезариус, который объединяет в себе все возможности и связи более простых форм. Тезариус также можно назвать книгой синонимов, в которой записаны синонимы, омонимы и антонимы, а также вышестоящие, нижестоящие и ассоциативные дескрипторы. При этом тезариус имеет особый формат сетевой базы данных, тесно взаимодействующей с пользовательским интерфейсом интрасети или веб-сайта.

Типы управляемых словарей по степени их сложности:

  • Кольца синонимов
  • Нормативные файлы
  • Схемы классификации
  • Тезариусы

Кольца синонимов

Кольцо синонимов объединяет слова, определенные, как эквивалентные для извлечения информации. Например, для сайта бытовой техники такое кольцо может быть представлено в следующем виде: кухонный комбайн – кухонный процессор – миксер – кухонный комбайн. Составление кольца синонимов необходимо по той причине, что пользователи часто ищут одну и ту же вещь под разными именами, близкими по смыслу.

При этом предпочтительный термин может отсутствовать и быть замененным кольцом синонимов, состоящим из эквивалентных слов, записанных в простой вордовский файл. Когда пользователь вводит свой запрос, система сравнивает его со словами в текстовом файле и выдает результаты поиска.

Продвижение сайта от 6 000
рублей месяц
+7 (927) 201-71-91

Заказать

Закажите сопровождение
сайта сегодня!

Заказать