Question

J'utilise SharePoint Server 2007 sur Windows Server 2008. J'utilise Centre de recherche Ramper source de données web (à savoir crawl page web à partir d'autres sites Web). Ma question est liée aux compteurs de pages analysées affiché pour la page du journal de source de données Web de Centre de recherche.

Ma question est, il y a 3 compteurs d'exploration affichés, le compteur de succès, l'échec contre et contre d'avertissement. Pour chaque valeur du compteur, il y aura des urls de duplication? Par exemple, il est rapporté pour la source de données web www.mysite.com, 1000 sont analysés avec succès, 10 a échoué, aucun avertissement. Est-ce que cela veut dire il y a 1000 pages web distincts stockés dans le Centre de recherche? Je ne sais pas s'il y a des urls dupliquées dans les 1000 pages comptés?

BTW: Je cette confusion parce que si je mets tous les jours crawl page supplémentaire, par exemple, http: // www.mysite.com/1.html est crawlered hier et d'aujourd'hui (les deux cas sont crawl avec succès), il sera compté deux fois? Apprécier si quelqu'un pouvait fournir des documents sur ce que sont la signification des compteurs?

Merci d'avance, George

Était-ce utile?

La solution

Si vous rampez un site Web régulier, il va suivre chacun des liens. Il ne faut pas reproduire les pages, mais il verra la référence à la page d'accueil par exemple de fois. En fin de compte vous déterminer le nombre de pages ou articles en regardant les éléments dans l'indice compte pas le nombre d'éléments analysés.

Licencié sous: CC-BY-SA avec attribution
Non affilié à sharepoint.stackexchange
scroll top