Domanda

Sto utilizzando SharePoint Server 2007 in Windows Server 2008. Sto usando Centro ricerche alla fonte di dati strisciare web (vale a dire crawl pagina web da altri siti web). La mia domanda è legata ai contatori di pagina per indicizzazione visualizzata la pagina di log dell'origine dei dati web di Centro ricerche.

La mia domanda è, ci sono 3 contatori scansione visualizzati, contatore di successo, riuscire contatore e contatore di avvertimento. Per ogni valore del contatore, ci saranno tutti gli URL duplicazione? Ad esempio, si segnala per la sorgente di dati web www.mysite.com, 1000 vengono scansionati con successo, 10 falliti, nessun avviso. Vuol dire ci sono 1000 pagine web distinte memorizzati nel Centro ricerche? Non sono sicuro se ci sono gli URL duplicati nelle 1000 pagine contati?

A proposito: ho questa confusione perché ho impostato tutti i giorni pagina incrementale per l'indicizzazione, ad esempio, se http: // www.mysite.com/1.html è crawlered ieri e di oggi (entrambi i casi sono crawl successo), sarà contato due volte? Apprezzare se qualcuno potrebbe fornire alcuni documenti sui quali sono significato dei contatori?

Grazie in anticipo, George

È stato utile?

Soluzione

Se la ricerca per indicizzazione di un sito web normale che sta per seguire ciascuno dei collegamenti. Non dovrebbe duplicare le pagine, ma vedrà il riferimento alla home page per esempio molte volte. In ultima analisi si potrebbe determinare il numero di pagine o articoli, cercando in Posta nell'Indice non conta il numero di elementi sottoposti a scansione.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a sharepoint.stackexchange
scroll top