Google 검색 어플라이언스가 사이트에서 깨진 링크를 보여주는 보고서를 생성 할 수 있습니까?

StackOverflow https://stackoverflow.com/questions/418288

  •  03-07-2019
  •  | 
  •  

문제

Google 검색 어플라이언스 가이 정보에 액세스 할 수 있다는 것을 알고 있지만 (이 요소가 PageRank 알고리즘에 대한 요소), Crawler 어플라이언스 에서이 정보를 내보낼 수있는 방법이 있습니까?

콘텐츠의 상당 부분이 회사 인트라넷을위한 것이기 때문에 외부 도구가 작동하지 않습니다.

도움이 되었습니까?

해결책 4

Xenu라는 무료 도구는이 작업을위한 선택의 무기로 판명되었습니다. http://home.snafu.de/tilman/xenulink.html#download

다른 팁

Google에서 사용할 수 있지만 확인한 적이 없습니다. 나는 보통 그것을 사용합니다 W3C에서 제공 한 링크 검사기. W3C One은 404 상태 코드를 반환하는 대신 리디렉션하여 서버가 404를 처리하는 경우 유용한 리디렉션을 감지 할 수 있습니다.

당신이 사용할 수있는 Google 웹 마스터 도구 무엇보다도 사이트에서 깨진 링크를 보려면.

그래도 외부 사이트에 대한 링크가 깨지는 것은 아닙니다.

이것이 불가능한 것 같습니다. 상태 및 보고서> 크롤링 진단에 따라 디렉토리 드릴 다운 '트리 뷰'와 한 번에 100 개의 URL이 '목록보기'라는 2 가지 스타일의 보고서가 있습니다. 어떤 사람들은 목록보기를 통해 페이지를 페이지로 만들려고 시도했지만 수천 URL 이후에는 실패한 것 같습니다.

제 조언은 대신 서버 로그를 사용하는 것입니다. 웹 서버에서 404 및 참조 URL 로깅이 활성화되어 있는지 확인하십시오. 아마도 링크가 포함 된 페이지를 수정하려고 할 수 있습니다.

그런 다음 a를 사용할 수 있습니다 로그 파일 분석기 깨진 링크 보고서를 생성합니다.

깨진 링크를 모니터링하는 효과적이고 장기적인 방법을 만들려면 다음을 수행하기 위해 CRON 작업을 설정할 수 있습니다.

  • 사용 grep 서버 로그 파일에서 404 개의 항목이 포함 된 줄을 추출합니다.
  • 사용 sed 모든 라인에서 요청 된 URL 및 참조 업체 URL을 제외한 모든 것을 제거합니다.
  • 사용 sort 그리고 uniq 목록에서 복제를 제거하는 명령.
  • 시간이 지남에 따라 변경 사항을 모니터링 할 수 있도록 결과를 매번 새 파일로 출력하십시오.

웹 서버 로그를 분석하고 404 페이지를 모두 찾으십시오. 그것은 훨씬 더 의미가 있고 훨씬 더 안정적입니다.

나는 이것이 오래된 질문이라는 것을 알고 있지만 GSA 관리 콘솔에서 내보내기 URL 기능을 사용한 다음 NOT_FOUND 상태의 URL을 찾을 수 있습니다. 이것은 GSA가 발견 한 모든 URL을 보여줄 것이지만 기어 다니려고 시도했을 때 404를 반환했습니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top