콘텐츠 소스 당 전용 서버
-
10-12-2019 - |
문제
나는 확신 할 수없는 질문이 있습니다.저는 SharePoint Search Specialist가 아닙니다. 우리는 여러 콘텐츠 소스가 있습니다.모든 것이 잘 작동합니다.
, 우리는 거대한 (1.5TB!), 불행히도 우리는 콘텐츠를 크롤링해야합니다 (데이터가 정적 인 것처럼 몇 개월마다 한 번씩).내 문제는이 사이트의 전체 크롤링을 시작하면 10 분마다 실행되어야하는 다른 콘텐츠 소스 증분 크롤링을 죽이고 약 5 분 안에 일반적으로 마무리됩니다.
다른 서버가 더 많은 크롤링 구성 요소를 추가 할 수 있지만, 내가 아는 한, 문제를 해결하지 못하면 크롤링 시간을 가져 오는 것만으로 조금 완화 될 것입니다.
어떻게 서버 1이 콘텐츠 소스 1 및 서버 2에 대해 책임을지는 것을 지정할 수 있습니까?그게 가능한가?또한 우리는 빠른 검색을 가지고 있지만 문제를 해결할 수 있는지 확실하지는 않습니다.어떤 피드백을받을 것입니다.
해결책
This isn't really possible without having multiple farms each with a separate Search Service Instance.
I would suggest you basically split out your 1.5TB of content into a separate farm with a dedicated Search instance. You can even use HOSTS entries on the crawl servers so they have their own local dedicated WFE servers for the crawl process to iterate through:
Farm 1 - Main Farm (business as usual) Farm 2 - 1.5TB Content and Specialist Search Farm
You can then federate the services you need between the two.
The alternative (which is a bit less documented but arguably more ideal) is to use the "Request Management" service which allows you to route specific service requests to specific servers. I don't really know too much about how that all works though..
다른 팁
I would do the following:
- priorize the incremental crawl with "high"
- priorize the new content source with "low"
- limit the requests to the new site in crawler impact rules
- start the crawl on friday night and pause it on monday - repeat until you have the main chunk indexed (use powershell to automate)
With this the impact should not be that hard.