ВебмастерМетрикаВиджетыРекламная сетьДиректПоиск для сайтаAPI
Войти

Руководство по установке и эксплуатации

В формате PDF

Метапоиск и его настройка

Метапоисковые источники

Поисковый сервер может работать в так называемом метапоисковом режиме. В этом случае выполняются поиски по одному или нескольким поисковым источникам. Результаты поисков по каждому источнику объединяются в окончательный результат, форма представления которого задается точно также, как и в режиме обычного поиска (см. Формирование страниц с результатами поиска и Директивы секции SearchPageTemplate).

Дополнительные индексы для метапоиска и соответствующие им коллекции документов называются метапоисковыми источниками и описываются в секциях SearchSource, по одной секции на индекс. Эти дополнительные индексы созданы другими поисковыми модулями (или индексаторами, совместимыми с ним) на этом же или на другом компьютере.

Конфигурация метапоисковых источников

Пример

<Collection>
    IndexDir : mainindex
    ...
    <SearchSource>
        CgiSearchPrefix : http://searcher1:17000/source
    </SearchSource>
    <SearchSource>
        CgiSearchPrefix : http://searcher2:17000/source
    </SearchSource>
    ...
    MetaSearchOptions : ...
    <QueryCache>
        Dir : cache
        ...
    </QueryCache>
    <SearchPageTemplate>
        ...
    </SearchPageTemplate>
</Collection>

Директивы конфигурационного файла метапоиска

Секция SearchSource должна включать директиву CgiSearchPrefix. Поиски по удаленным источникам выполняются в своих собственных процессах, работающих на этом же или на других компьютерах. Данный метапоисковый процесс направляет удаленным источникам запросы и получает от них результаты поиска по протоколу HTTP в специальном формате, после чего объединяет полученные результаты в окончательный результат поиска.

Директива Описание
IndexDir

Указывает путь к каталогу с индексом.

Несмотря на то, что при метапоиске никакого индекса не создается, системе необходимо указать этот путь, предварительно поместив файлы, созданные при индексации любого массива.

Секция QueryCache
В случае метапоиска, для повышения эффективности работы системы желательно наличие секции QueryCache в конфигурации поиска.
Cекция SearchSource
CgiSearchPrefix

Указывает HTTP-адрес поисковой страницы на удаленном поисковом источнике.

Например, удаленный поисковый источник является коллекцией документов поискового модуля, установленного на порту 17000 компьютера с интернет-адресом www.metasource.ru. Эта коллекция описывается в секции Collection конфигурационного файла этого удаленного поискового модуля, имеющей атрибут id со значением name1. Тогда значением данной директивы, описывающим этот удаленный источник, будет http://www.metasource.ru:17000/name1/.

MetaSearchOptions

Определяет метод получения цитат с найденными словами.

Аргументы директивы описаны ниже.

Необязательная директива.

Аргументы директивы MetaSearchOptions

Описание директивы приведено выше.

Аргумент Описание
OneStepQuery В случае удаленных источников получать всю информацию в одном запросе.
TwoStepQuery

В случае удаленных источников получать отрывки текста документа с найденными словами во втором запросе.

Эта опция полезна для оптимизации времени отклика в случае большого числа однородных поисковых источников.

Значение по умолчанию: OneStepQuery.