ВебмастерМетрикаВиджетыРекламная сетьДиректПоиск для сайтаAPI
Войти

Руководство по установке и эксплуатации

В формате PDF

Общие сведения

Комплект поставки и установка

Индексатор может входить в состав программного комплекса Яндекс.Сервера или представлять собой отдельную программу Индексатор, предназначенную для создания индексных файлов, совместимых с поисковым модулем Яндекс.Сервера.

Если индексатор входит в состав Яндекс.Сервера, следуйте инструкциям, приведенным в документации к этому пакету. Установка Индексатора сводится к распаковке архива в произвольный каталог.

Выполняемый модуль Индексатора представляет собой файл с именем dsindexer (UNIX) или dsindexer.exe (Windows). По умолчанию для настройки программы используется конфигурационный файл dsindexer.cfg, который должен находиться в рабочем каталоге, то есть каталоге, из которого запущена программа. В отсутствие конфигурационного файла основные режимы работы Индексатора могут быть заданы ключами -w, -f и -r командной строки.

Настройка с помощью конфигурационного файла

Для настройки Индексатора найдите или создайте в рабочем каталоге файл dsindexer.cfg и отредактируйте его в любом текстовом редакторе. dsindexer.cfg представляет собой текстовый файл, в котором перечислены директивы, задающие параметры индексатора.

Индексатор позволяет индексировать документы как на веб-страницах, так и в локальных каталогах.

Для индексирования веб-страниц напишите в dsindexer.cfg следующее:

<Collection>
    <DataSrc id="webds">
        Config : -w www.firma.ru/index.html
    </DataSrc>
</Collection>

В качестве значения опции -w директивы Config укажите адрес веб-страницы, которая будет проиндексирована первой. Адреса последующих страниц будут получены индексатором в результате анализа гипертекстовых ссылок. В итоге будут проиндексированы все страницы в домене www.firma.ru, на которые можно перейти по ссылкам с первой страницы.

Для индексирования локальных каталогов напишите в dsindexer.cfg следующее:

<Collection>
    <DataSrc id="ftds">
        Config : -f ../mybook
    </DataSrc>
</Collection>

В качестве значения опции -f директивы Config укажите каталог, файлы в котором надо проиндексировать. Можно указать абсолютный путь или путь относительно рабочего каталога. Будут проиндексированы все файлы с расширениями .htm, .html и .shtml, размещенные в указанном каталоге и ему подчиненных.

Запуск

Запустите индексатор, набрав в командной строке имя выполняемого файла. Если запуск произойдет успешно, то вы получите сообщение, похожее на это:

Yandex Indexer 3.1.5
Use config-file 'dsindexer.cfg'.
Start indexing...
Indexing was started at Fri Nov 29 19:16:33 2002

А затем, через некоторое время:

455 documents have been added.
Total 455 documents have been indexed.
Indexing was finished at Fri Nov 29 19:17:07 2002
Index contains 455 documents with the total size 3282224 bytes

Это говорит о том, что индексатор нашел 455 документов, обработал их и успешно завершил работу.

Использование ключей командной строки

Для быстрого запуска Индексатора могут быть использованы ключи командной строки, описанные ниже. При наличии ключей -f или -w конфигурационный файл может отсутствовать.

dsindexer [-h] [-l] [-k]  [-w WEB_PAGE] [-f DIR_TO_INDEX] [-r] [-i OLD_INDEX_DIR] [CONFIG_FILE]
  -h - вывести подсказку
  -l - напечатать текущие ограничения и конфигурацию без индексирования
  -k - сохранить предыдущий индекс
  -w - начать индексирование со страницы WEB_PAGE
       (эквивалентно директиве "StartUrls" источника данных WEBDS)
  -f - начать индексирование с локального каталога DIR_TO_INDEX
       (эквивалентно директиве "Folder/Path" источника данных FTDS )
  -r - переиндексировать предыдущий индекс
       (эквивалентно директиве "GlobalOptions Reindex" в CONFIG_FILE)
  -i - обновить предыдущий индекс в OLD_INDEX_DIR
       (эквивалентно директиве "IndexDir" в CONFIG_FILE)
CONFIG_FILE - конфигурационный файл, "dsindexer.cfg" по умолчанию.
Ключ Описание
-h Вывести подсказку.
-l Напечатать текущие ограничения и конфигурацию без индексирования.
-w WEB_PAGE

Указывает адрес веб-страницы, которая будет проиндексирована первой.

Эквивалентен директиве StartUrls конфигурационного файла источника webds.

-f DIR_TO_INDEX

Указывает локальный каталог, файлы в котором надо проиндексировать.

Эквивалентен директиве Path секции Folder конфигурационного файла источника ftds.

-i OLD_INDEX_DIR

Указывает каталог, в котором могут находиться рабочие индексные файлы, созданные при предыдущем индексировании.

Эквивалентен директиве IndexDir конфигурационного файла.

В случае использования данного ключа указанная директива конфигурационного файла игнорируется.

-r

Полностью переиндексировать предыдущий индекс (индекс создается заново, старый удаляется).

Эквивалентен директиве GlobalOptions : Reindex конфигурационного файла.

В случае использования данного ключа указанная директива конфигурационного файла игнорируется.

-k

Если с помощью ключа -r или с помощью директивы IndexDir конфигурационного файла указан каталог с индексными файлами, созданными при предыдущем индексировании, то после успешного окончания нового индексирования предыдущие индексные файлы будут по умолчанию автоматически заменены на новые.

В случае задания ключа -k предыдущий индекс будет оставлен неизменным, а новый индекс сохранен в каталоге TempDir для временных файлов.