Вопрос

Я использую SharePoint Server 2007 на Windows Server 2008. Я использую поисковый центр для ползания источника веб -данных (т.е. веб -страница Crawl с других веб -сайтов). Мой вопрос связан с ползающими счетчиками страниц, отображаемых для журнала журнала источника веб -данных в центре поиска.

Мой вопрос: отображается 3 стойки для ползания, успешный счетчик, сбой и счетчик предупреждения. Для каждого значения счетчика будут ли какие -нибудь URL -адреса дублирования? Например, он сообщается для источника веб -данных www.mysite.com, 1000 успешно ползают, 10 неудачных, без предупреждения. Означает ли это, что в поисковом центре хранится 1000 различных веб -страниц? Я не уверен, есть ли какие -либо дублированные URL -адреса на 1000 подсчитанных страницах?

Кстати: у меня есть эта путаница, потому что я устанавливаю ежедневную дополнительную страницу, например, если http://www.mysite.com/1.html Пользуется ли вчера и сегодня (оба случая успешно ползут), будет ли он подсчитываться дважды? Цените, если бы кто -нибудь мог предоставить несколько документов о том, что означает счетчики?

заранее спасибо Джордж

Это было полезно?

Решение

Если вы ползете на обычном веб -сайте, он будет следить за каждой из ссылок. Это не должно дублировать страницы, но, например, много раз увидит ссылку на домашнюю страницу. В конечном итоге вы определите количество страниц или предметов, рассматривая элементы в индексе, а не на количество предметов, которые ползают.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с sharepoint.stackexchange
scroll top