Как обустроить мансарду?



Как создать искусственный водоем?



Как наладить теплоизоляцию?



Как сделать стяжку пола?



Как выбрать теплый пол?



Зачем нужны фасадные системы?



Что может получиться из балкона?


Главная страница » Энциклопедия строителя

содержание:
[стр.Введение] [стр.1] [стр.2] [стр.3] [стр.4] [стр.5]

страница - 3

Указатели типов и форматов данных

Цель введения указателей типов и форматов данных - ограничить результирующий список страниц, только теми страницами, которые содержат данные заданного типа или формата. Например, можно указать типы: audio, video, images, VB script и т.п., или впрямую указать расширение файла встроенных данных.

Ограничения по дате

Для ограничения результирующего списка страниц по времени их создания (или последнего изменения) вводится диапазон дат. Некоторые ПМ предлагают только открытые диапазоны по принципу "не позже" или "не раньше".

Указатели области web-пространства

Для ограничения области поиска в Web-пространстве в язык запроса вводятся следующие указатели:

-указатель домена (com, edu, org и т.п.) - в результаты включаются только страницы, принадлежащие указанному домену;

-указатель кода страны (ru, us, uk, fr и т.п.) - в результаты включаются только страницы, содержащие в адресе указанный код страны;

-указатель адреса сайта или его подкатолога - в результаты включаются только страницы, принадлежащие указанному сайту или подкатологу;

-указатель "только главные страницы" - в результаты включаются только главные страницы сайтов (home pages).

Мета-слова

Кроме ключевых слов, в качестве операндов поискового выражения в некоторых ПМ могут использоваться мета-слова (управляющие слова). По сути, это другая форма задания ограничений, которая позволяет отнести ограничения не ко всему запросу, а к отдельным операндам поискового выражения.

Обычно термин, в составе которого используется мета-слово, представляет собой конструкцию [мета-слово][символ - разделитель][параметр]. Символом - разделителем может служить двоеточие, знак равенства и др. Параметром может служить ключевое слово или выражение, дата, домен или код страны, тип данных и т.п. Пример: управляющее слово title обеспечивает поиск в заголовке, т.е. запрос, содержащий title:president приведет к получению документов со словом president в их заголовках.

Параметры процедур выполнения запроса Управление параметрами сортировки результатов

Некоторые ПМ позволяют в запросе задавать параметры расчета показателей релевантности. Пользователю может быть предоставлена возможность


управлять следующими параметрами, которые учитываются при вычислении показателя релевантности страниц:

-перечень слов, которые должны быть определяющими при определении показателя релевантности страниц;

-веса ключевого слова.

AltaVista предлагает, кроме ключевых слов, которые составляют поисковое выражение, ввести еще и перечень слов, присутствие которых в страницах существенным образом влияет на ранжирование результатов.

Число, поставленное в конце ключевого слова ^ndex) - есть весовой коэффициент, который учитывается при определении релевантности страницы. Больший показатель релевантности будет иметь страница, в которой (при прочих равных условиях) встречается слово с большим весовым коэффициентом. В других случаях вес отдельных слов может быть увеличен или уменьшен знаками "+" и "-".

Кроме этого, некоторые ПМ предоставляют возможность заказать сортировку результатов по одному из критериев: по датам создания или последнего изменения страниц, по заголовкам, по принадлежности к сайтам (группировка по сайтам), и по глубине вложенности в дереве сайта.

Повторный поиск

После получения результатов многие ПМ могут выполнить повторный поиск с учетом предварительно полученных результатов:

-поиск в найденном - поиск по новому запросу, но только в страницах из списка результатов, полученных в результате исполнения предыдущего запроса;

-поиск "похожих" страниц - "похожесть" на выбранную пользователем страницу из списка результатов определяется ПМ по специальным алгоритмам;

-"связанный" поиск - после выполнения поиска ПМ предлагает пользователю несколько запросов, которые ПМ составляет по специальным алгоритмам, опираясь на ключевые слова исполненного запроса.

Параметры формы представления результатов

При формировании запроса многие ПМ позволяют устанавливать следующие параметры и опции формы представления результатов:

-количество результатов, которые предоставляются одновременно на одной странице результатов (обычно это 1 0, 20, 50, 1 00);

-максимальный объем заголовка в символах;

-максимальный объем краткого описания страницы в символах;

-варианты представления характеристики страницы: обычное описание, краткое описание, только адрес, только заголовки, показывать найденный документ целиком;

-показывать даты создания или последнего изменения документа;

-показать только количество результатов;


-группировка результатов - включение в ответ не более одной страницы от сайта;

-показать первую страницу из списка найденных.

В таблице приведены сведения о функциональных возможностях языков запроса 21-ой из наиболее известных ПМ, в т.ч. 4-х отечественных.

Анализ существующих ПМ показывает, что несмотря на существенный и качественный рост этого инструмента Интернет-технологии, наблюдаемый в последнее время, пользователи Интернет не должны переоценивать потенциальную эффективность их использования.

Во-первых, метод поиска на основе ключевых слов имеет существенные ограничения из-за низкой семантической сислы языков запроса, построенных на ключевых словах. Недаром существует много высказываний, относящих поиск в Web в большей степени к искусству, нежели к науке.

Во-вторых, эффективное использование метапоисковых средств, в принципе повышающих охват Web-пространства при поиске, существенно ограничено большим разнообразием языковых средств первичных ПМ и сравнительно небольшим их "пересечением".

По мнению авторов, дальнейшее развитие инструментов поиска в Web-пространстве Bynthytn должно идти по двум основным направлениям:

-создания унифицированного языка запросов к поисковым машинам, обобщающего поисковые возможности современных ПМ;

-интеграции отдельных технологий, применяемых при при поиске информации в Web-пространстве Интернет, в единую систему как на концептуальном уровне, так и на уровне практической реализации этого подхода.

В следующих статьях этой серии авторы попытаются изложить свои позиции по реализации этих направлений.




содержание:
[стр.Введение] [стр.1] [стр.2] [стр.3] [стр.4] [стр.5]

© ЗАО "ЛэндМэн"