문제

제가 가지고 있는 두 개의 개별 팜에서 크롤링을 작동시키려고 하는데 어느 쪽에서도 작동하도록 할 수 없습니다.둘 다 인덱스 서버로 구성된 추가 WFE와 함께 두 개의 WFE를 가지고 있습니다.쿼리 전용 서버가 한 대 더 있고 데이터베이스용으로 클러스터된 SQL 2005 백엔드 서버가 두 대 더 있습니다.나는 검색 엔진의 솔루션을 통해 찾은 최소 50개의 웹사이트를 시도했지만 실패했습니다.사용할 웹 앱을 구성(확장)했습니다. http://서버이름:12345 기본 영역으로 http://abc.companyname.com 사용자 정의 및 인트라넷 영역으로.콘텐츠 소스에 각 항목을 입력한 다음 크롤링을 실행하려고 하면 크롤링 로그에 몇 가지 오류가 발생합니다.

http://서버이름:12345 보고:
"서버에 연결할 수 없습니다.사이트에 액세스할 수 있는지 확인하세요."

http://abc.companyname.com 보고:
"게더러에 의해 삭제되었습니다.(이 항목이 포함된 시작 주소 또는 콘텐츠 소스가 삭제되었으므로 이 항목도 삭제되었습니다.)"

그러나 두 URL을 모두 클릭하면 페이지에 액세스할 수 있습니다.

어떤 아이디어가 있나요?


더 많은 정보:

말하자면, 나는 슬레이트를 깨끗이 닦고 업데이트된 샘플을 제공하기 위해 또 다른 크롤링을 실행했습니다.

내 콘텐츠 소스는 다음과 같습니다.

http://서버이름:33333
http://sharepoint.portal.fake.com
sps3://서버 이름:33333

현재 크롤링 로그 오류는 다음과 같습니다.

sps3://서버 이름:33333
PortalCrawl 웹 서비스에 오류가 있습니다.

http://서버 이름:33333/mysites
이 URL의 콘텐츠는 색인이 없는 속성으로 인해 서버에서 제외됩니다.

http://서버 이름:33333/mysites
크롤링됨

sts3://서버 이름:33333/contentdbid={62a647a...
크롤링됨

sts3://서버 이름:33333
크롤링됨

http://서버이름:33333
크롤링됨

http://sharepoint.portal.fake.com
크롤러가 서버와 통신할 수 없습니다.서버를 사용할 수 있는지, 방화벽 액세스가 올바르게 구성되었는지 확인하세요.

위에 오타가 있는지 다시 확인했는데 아무 것도 표시되지 않으므로 정확하게 반영되어야 합니다.

도움이 되었습니까?

해결책

한 가지 기억해야 할 점은 SharePoint 사이트 크롤링은 파일 공유 또는 비SharePoint 웹 사이트 크롤링과 다르다는 것입니다.

몇 가지 다른 빠른 지침:

  • sps3:프로토콜은 사용자 검색을 위한 사용자 프로필을 크롤링하기 위한 것입니다.사용자 프로필이 준비될 때까지 크롤러가 말하는 모든 내용을 무시할 수 있습니다.
  • 크롤링 계정은 전체 팜에 액세스할 수 있어야 합니다.권한 오류가 표시되면 크롤링 계정을 재설정하는 방법(특정 stsadm.exe 명령)을 설명하는 KB 문서를 찾으세요.다른 팜의 콘텐츠를 크롤링하려는 경우 크롤링 계정에 액세스 권한을 부여하기 위해 다른 조치를 취해야 합니다.나는 이것이 현재 가장 큰 문제라고 생각합니다.
  • 크롤러(인덱스 서버에서 실행)는 공개 URL을 방문하려고 시도합니다.이전에 서버 간 통신 문제가 있었습니다.세 서버가 모두 서로 핑할 수 있는지 확인하고 인덱스 서버가 공개 URL에 도달할 수 있는지 확인하세요(인덱스 서버에서 IE를 열고 확인하세요).문제가 있으면 인덱스 서버의 호스트 파일을 더럽혀야 할 때입니다.이는 어쨌든 SharePoint가 수행하는 작업이므로 너무 나쁘게 생각하지 마십시오.Windows 통합 인증 외에 다른 것을 설정한 경우 크롤러가 작동하도록 하려면 더 많은 노력을 기울여야 합니다.

어쨌든, 답변이 많이 오갔기 때문에 저는 단지 여러 가지 제안을 횡설수설하고 있을 뿐입니다. 어쩌면 그 중 하나가 목표에 부합할 수도 있습니다.

다른 팁

귀하의 팜 토폴로지가 약간 혼란 스럽습니다.WFE로만 설치된 머신은 인덱서가 될 수 없습니다."전체"로 설치된 머신은 인덱서, 쿼리 및/또는 WFE일 수 있습니다.

또한 기본 콘텐츠 액세스 계정을 변경하는 대신 크롤링 규칙을 추가할 수도 있습니다(모든 것이 실행되고 나면).

인덱서의 %commonprogramfiles%/microsoft shared/web server Extensions/12/logs에 유용한 내용이 있는지 확인할 수 있습니까?

로그 파일은 다소 장황할 수 있습니다. "시작됨" 또는 "전체"를 검색하면 일반적으로 크롤링이 시작된 로그 줄로 이동하게 됩니다.

또한 SQL 머신에서는 MSScrawlurlhistory 테이블에서 더 많은 정보를 얻을 수 있습니다.

다음에 대한 콘텐츠 소스를 만들 수 있나요? http://www.cnn.com 전체 크롤링을 시작하시겠습니까?같은 오류가 발생합니까?

또한 이 작업을 오프라인으로 전환하고 싶을 수도 있습니다. 그렇게 하고 싶다면 알려주세요.

그래도 stackoverflow를 통해 개인 메시지를 보내는 방법이 있는지 잘 모르겠습니다.

대부분의 문제는 Kerberos와 관련이 있는 것 같습니다.인프라 업데이트를 적용하지 않은 경우 Sharepoint는 기본이 아닌(80/443) 포트가 있는 웹 사이트에 대해 kerberos 인증을 사용할 수 없습니다.이것이 바로 서버 4에 있을 때 서버 5에서 CA에 액세스할 수 없는 이유이기도 합니다.SPN이 올바르게 설정되어 있지 않으면 CA가 설치된 시스템에서만 CA에 액세스할 수 있습니다.포트 80을 기본 URL로 사용하여 Sharepoint를 설치한 경우 문제 없이 로컬 Sharepoint 크롤링을 수행할 수 있습니다.그러나 설계상 로컬 Sharepoint 사이트 크롤링은 기본 URL을 사용하여 Sharepoint 사이트에 액세스합니다.확인해 보세요 http://codefrob.spaces.live.com/blog/cns!7C69E7B2271B08F6!363.entry Kerberos와 Sharepoint가 함께 잘 작동하도록 하는 방법에 대해 좀 더 자세히 알아보세요.

서버 제공 서비스 섹션에서 검색 크롤링 계정의 속성을 확인하여 계정이 설정되어 있는지, 해당 사이트에 액세스할 수 있는 권한이 있는지 확인하세요.

새로운 의견을 보내주셔서 감사합니다!

그래서 주말에 돌아와서 여러분의 조언을 살펴보고 모든 방법을 시도한 다음 어떻게 작동하지 않았는지 보고하고 얻은 결과를 게시하고 싶었습니다.그런데 재미있는 일이 일어났습니다.

내 Indexer(servername5)로 이동하여 Internet Explorer에서 중앙 관리 및 기본 포털에 연결을 시도했습니다.둘 다 작동하지 않았습니다.그래서 IIS 내에서 기본 포털을 찾아보기 위해 Indexer의 IIS로 이동했습니다.그것도 작동하지 않았고 다른 것이 해당 포트를 사용하고 있다는 오류를 받았습니다.그래서 이전 빌드의 이전 웹 사이트를 보고 해당 응용 프로그램 풀과 함께 IIS에서 이를 삭제했습니다.그런 다음 새 빌드에서 웹 사이트용 앱 풀을 시작하고 웹 사이트를 탐색했습니다.성공.그런 다음 내 PC의 브라우저에서 웹사이트를 탐색했습니다.다시 성공했습니다.그런 다음 다음과 같이 서버 이름이 아닌 전체 URL로 크롤링을 실행했습니다.

http://sharepoint.portal.fake.com

다시 성공했습니다.내가 원하는 대로 하위 사이트를 포함한 전체 포털을 크롤링했습니다."색인의 항목"이 빠르게 채워졌고 롤링 중임을 알 수 있었습니다.

여전히 servername5에서 servername4에 호스팅된 중앙 관리 사이트에 액세스할 수 없습니다.왜 안되는지는 잘 모르겠지만 현재로서는 그것이 그다지 중요하다는 것을 모르겠습니다.

이것이 나를 어디로 떠나게 하는가?수정 사항은 무엇이었나요?

아직 잘 모르겠습니다.아마도 재건축이었을 겁니다.아마도 서버 팜을 재구축하자마자 서버 팜이 작동하도록 하는 데 필요한 모든 것이 갖추어져 있었지만 이전 웹 사이트가 여전히 IIS에 있기 때문에 작동하지 않았을 것입니다.(SharePoint 제거가 얼마나 엉성할 수 있는지 재밌습니다.콘텐츠 데이터베이스, 웹 사이트 및 응용 프로그램 풀을 수동으로 삭제하는 것은 필요해 보이지만 그렇게 해서는 안 됩니다.)

어쨌든 현재 내 "테스트" 팜에서 작동하고 있으므로 핵심은 프로덕션 팜에서 작동하게 하는 것입니다.이번 경험 이후에는 그렇게 어렵지 않을 거라 믿습니다.

모두의 도움에 감사드립니다!

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top