Domanda

Come per questa domanda quando ci muoviamo raccolte siti in giro, cadono dai risultati della ricerca. La nostra ultima ricerca per indicizzazione completa ha assunto 8 giorni e mentre questo sta accadendo non otteniamo risultati incrementali che non rendono felici gli utenti.

Abbiamo circa 100.000 raccolte siti distribuiti in 21 database del contenuto con quasi un terrabyte dei dati. Le raccolte siti sono fondamentalmente autosufficiente progetti. Quando il progetto è finito, noi archiviamo la raccolta siti in un database del contenuto dell'archivio in modo che i documenti sono ancora disponibili e ricercabili. Purtroppo, quando si passa una raccolta siti (utilizzando stsadm) tutti gli elementi in esso cadono dall'indice di ricerca.

Così ho pensato di rompere il sito fino in fonti di contenuti, una per ogni database del contenuto. Allora posso fare in modo incrementale completa indicizzazione dei vari database del contenuto più di una settimana o due, senza perdere tutti i miei risultati di ricerca incrementale per le altre fonti di contenuti. Tuttavia, muniti di una fonte di contenuti crawl un database di contenuto non è un'opzione a fonti di contenuti SharePoint 2007.

Le basi di dati in tempo reale sono circa 2.000 raccolte siti ei database del contenuto dell'archivio avere circa 10.000 raccolte siti. Ho potuto ottenere un elenco di raccolte siti in un database del contenuto e avere una fonte di contenuti che utilizza tale elenco, ma oltre 10.000 voci potrebbe essere un po 'troppo.

Chiunque ha ottenuto alcune buone idee su distribuire il carico di ricerca?

È stato utile?

Soluzione

Avere fonti di contenuti separati è una buona idea. Hai bisogno di questo se si desidera gestire le pianificazioni di ricerca per indicizzazione separatamente. I limiti consigliati sono 100 indirizzi iniziali per origine di contenuto, e 50 fonti di contenuti per ogni applicazione di ricerca.

Piuttosto che un sacco aggiuntivi di inizio URL alle vostre fonti di contenuti, che sarebbe difficile da gestire e vi porterà al di fuori dei limiti supportati, si potrebbe trovare più semplice creare una pagina dinamica che contiene collegamenti a tutte le raccolte siti nel suo sito web database e l'uso che il tuo indirizzo di partenza per l'origine di contenuto.

10.000 raccolte siti a database del contenuto suona un po 'alto (massimo consigliato è 5000).

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a sharepoint.stackexchange
scroll top