3 Мета-дані та пошук
Метадані - це інформація про інформацію: точніше, це структурована інформація про ресурси.
- Вони можуть бути простими, як ім'я автора або ж складними, як географічний код або контрольований словником індекс.
- Каталоги бібліотеки є віддаленими мета-даними, так само як і огляди книг, індекси для колекції творів мистецтва і резюме.
- Деякі формати документів дозволяють всталяти метадані в документи або записи, такі як HTML <meta> теги і Dublin Core теги, MP3 ID3 поля, Microsoft Office Properties, Adobe XAP дані, і поля бази даних ключових слів.
Метадані як правило, використовують більш контрольований словник, і це забезпечує певний контекст слів, так що вони дають більше можливостей для розміщення корисної інформації з кращою запамятовуваністю і точністю. Наприклад, метадані можуть вказати, чи є продукт, що містить ім'я "Tim Berners-Lee" від Нього, або про нього, які часто можуть бути цінним для шукачів. Стандартні формати дати дозволяють уточнити діапазон дат пошуку та сортування. Метадані можуть бути посередниками між внутрішніми кодами і зрозумілими для людей іменами, дати людям можливість знайти інформацію, як вони цього хочуть, а не так як це роблять програми .
Багато систем управління контентом і публікаціями використовують інструменти метаданих, які дозволяють авторам, редакторам і бібліотекарям, додавати відповідні записи більш легко, і використовувати стандартний словник та форматування. Тим не менш, це ще не є стандартною частиною веб-публікації.
Метадані на більшості сайтів мають суттєві недоліки та обмеження:
- багато документів не містять метаданих
- не усі пошукові системи розпізнають додаткові поля метаданих і тегів
- немає ніякого способу дізнатися, чи є метадані точними
- часто зустрічаються орфографічні і друкарські помилки
- значення слів з часом змінюються, тому важко вибрати точні ключові слова і категорії
- редагування та управління метаданими вимагає значних витрат ресурсів.
Все це роблять пошукові двигун метаданих або ключових слів, які шукають тільки призначені ключові слова, а не текст документа, це є більш корисним і цінним, ніж система пошуку по усьому тексту. Найкращим рішеням є пошук по усьому тексті і використання метаданих для покращення відповідності пошуковому запиту.