Pregunta

Tengo una pregunta que no estoy segura puede lograrse.Tenga en cuenta que no soy un especialista en búsqueda de SharePoint. Tenemos múltiples fuentes de contenido.Todo está funcionando bien.

Recientemente, agregamos un nuevo sitio que es masivo (1.5TB!), Y, lamentablemente, necesitamos rastrear el contenido (solo una vez cada pocos meses, ya que los datos son estáticos).Mi problema es que una vez que comience a un rastreo completo de este sitio, mata a los otros rastreros incrementales de fuentes de contenido que tiene que correr cada 10 minutos y normalmente termina en unos 5 minutos.

Tenemos otros servidores disponibles donde puedo agregar más componentes de rastreo, pero por lo que sé, eso no resolverá el problema, simplemente lo aliviará un poco reduciendo los tiempos de rastreo.

¿Cómo puedo especificar que el servidor 1 debe ser responsable de la fuente de contenido 1 y el servidor 2 el resto?¿Es eso posible?También tenga en cuenta que tenemos búsqueda rápida, pero no estoy seguro de si eso puede resolver el problema tampoco.Cualquier retroalimentación sería apreciada.

¿Fue útil?

Solución

This isn't really possible without having multiple farms each with a separate Search Service Instance.

I would suggest you basically split out your 1.5TB of content into a separate farm with a dedicated Search instance. You can even use HOSTS entries on the crawl servers so they have their own local dedicated WFE servers for the crawl process to iterate through:

Farm 1 - Main Farm (business as usual) Farm 2 - 1.5TB Content and Specialist Search Farm

You can then federate the services you need between the two.

The alternative (which is a bit less documented but arguably more ideal) is to use the "Request Management" service which allows you to route specific service requests to specific servers. I don't really know too much about how that all works though..

Otros consejos

I would do the following:

  1. priorize the incremental crawl with "high"
  2. priorize the new content source with "low"
  3. limit the requests to the new site in crawler impact rules
  4. start the crawl on friday night and pause it on monday - repeat until you have the main chunk indexed (use powershell to automate)

With this the impact should not be that hard.

Licenciado bajo: CC-BY-SA con atribución
scroll top