- продвинуть сайты
- |
- статьи о сайтах
- |
- Тезаурусы, управляемые словари и метаданные
Тезаурусы, управляемые словари и метаданные
Метаданные
Определение метаданным дать довольно сложно, но в общем случае их можно назвать описательными данными, в которых содержится информация о других данных, с которыми производятся какие-либо действия в среде или приложении. Метаданные могут содержать в себе характеристики данных, информацию об их контексте, состоянии или качестве.
С помощью метаданных описывают аудио- и видеофайлы, графику, программы и приложения, а также любые другие элементы страницы сайта. Теги метаданных не видны в интерфейсе, но доступны поисковым механизмам и упрощают переходы по ссылкам или извлечение данных.
Управляемые словари и тезариусы
Под управляемым словарем понимают любое подмножество естественного языка. В общем случае словарь представляет собой список эквивалентных или предпочтительных терминов, записанных в нормативном файле. Если установить между терминами иерархические отношения, то получится схема классификации, а если добавить ассоциативные связи, то получится тезариус, который объединяет в себе все возможности и связи более простых форм. Тезариус также можно назвать книгой синонимов, в которой записаны синонимы, омонимы и антонимы, а также вышестоящие, нижестоящие и ассоциативные дескрипторы. При этом тезариус имеет особый формат сетевой базы данных, тесно взаимодействующей с пользовательским интерфейсом интрасети или веб-сайта.
Типы управляемых словарей по степени их сложности:
- Кольца синонимов
- Нормативные файлы
- Схемы классификации
- Тезариусы
Кольца синонимов
Кольцо синонимов объединяет слова, определенные, как эквивалентные для извлечения информации. Например, для сайта бытовой техники такое кольцо может быть представлено в следующем виде: кухонный комбайн – кухонный процессор – миксер – кухонный комбайн. Составление кольца синонимов необходимо по той причине, что пользователи часто ищут одну и ту же вещь под разными именами, близкими по смыслу.
При этом предпочтительный термин может отсутствовать и быть замененным кольцом синонимов, состоящим из эквивалентных слов, записанных в простой вордовский файл. Когда пользователь вводит свой запрос, система сравнивает его со словами в текстовом файле и выдает результаты поиска.