문제

나는 확신 할 수없는 질문이 있습니다.저는 SharePoint Search Specialist가 아닙니다. 우리는 여러 콘텐츠 소스가 있습니다.모든 것이 잘 작동합니다.

, 우리는 거대한 (1.5TB!), 불행히도 우리는 콘텐츠를 크롤링해야합니다 (데이터가 정적 인 것처럼 몇 개월마다 한 번씩).내 문제는이 사이트의 전체 크롤링을 시작하면 10 분마다 실행되어야하는 다른 콘텐츠 소스 증분 크롤링을 죽이고 약 5 분 안에 일반적으로 마무리됩니다.

다른 서버가 더 많은 크롤링 구성 요소를 추가 할 수 있지만, 내가 아는 한, 문제를 해결하지 못하면 크롤링 시간을 가져 오는 것만으로 조금 완화 될 것입니다.

어떻게 서버 1이 콘텐츠 소스 1 및 서버 2에 대해 책임을지는 것을 지정할 수 있습니까?그게 가능한가?또한 우리는 빠른 검색을 가지고 있지만 문제를 해결할 수 있는지 확실하지는 않습니다.어떤 피드백을받을 것입니다.

도움이 되었습니까?

해결책

This isn't really possible without having multiple farms each with a separate Search Service Instance.

I would suggest you basically split out your 1.5TB of content into a separate farm with a dedicated Search instance. You can even use HOSTS entries on the crawl servers so they have their own local dedicated WFE servers for the crawl process to iterate through:

Farm 1 - Main Farm (business as usual) Farm 2 - 1.5TB Content and Specialist Search Farm

You can then federate the services you need between the two.

The alternative (which is a bit less documented but arguably more ideal) is to use the "Request Management" service which allows you to route specific service requests to specific servers. I don't really know too much about how that all works though..

다른 팁

I would do the following:

  1. priorize the incremental crawl with "high"
  2. priorize the new content source with "low"
  3. limit the requests to the new site in crawler impact rules
  4. start the crawl on friday night and pause it on monday - repeat until you have the main chunk indexed (use powershell to automate)

With this the impact should not be that hard.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 sharepoint.stackexchange
scroll top