Google 검색 어플라이언스가 사이트에서 깨진 링크를 보여주는 보고서를 생성 할 수 있습니까?
-
03-07-2019 - |
문제
Google 검색 어플라이언스 가이 정보에 액세스 할 수 있다는 것을 알고 있지만 (이 요소가 PageRank 알고리즘에 대한 요소), Crawler 어플라이언스 에서이 정보를 내보낼 수있는 방법이 있습니까?
콘텐츠의 상당 부분이 회사 인트라넷을위한 것이기 때문에 외부 도구가 작동하지 않습니다.
해결책 4
Xenu라는 무료 도구는이 작업을위한 선택의 무기로 판명되었습니다. http://home.snafu.de/tilman/xenulink.html#download
다른 팁
Google에서 사용할 수 있지만 확인한 적이 없습니다. 나는 보통 그것을 사용합니다 W3C에서 제공 한 링크 검사기. W3C One은 404 상태 코드를 반환하는 대신 리디렉션하여 서버가 404를 처리하는 경우 유용한 리디렉션을 감지 할 수 있습니다.
당신이 사용할 수있는 Google 웹 마스터 도구 무엇보다도 사이트에서 깨진 링크를 보려면.
그래도 외부 사이트에 대한 링크가 깨지는 것은 아닙니다.
이것이 불가능한 것 같습니다. 상태 및 보고서> 크롤링 진단에 따라 디렉토리 드릴 다운 '트리 뷰'와 한 번에 100 개의 URL이 '목록보기'라는 2 가지 스타일의 보고서가 있습니다. 어떤 사람들은 목록보기를 통해 페이지를 페이지로 만들려고 시도했지만 수천 URL 이후에는 실패한 것 같습니다.
제 조언은 대신 서버 로그를 사용하는 것입니다. 웹 서버에서 404 및 참조 URL 로깅이 활성화되어 있는지 확인하십시오. 아마도 링크가 포함 된 페이지를 수정하려고 할 수 있습니다.
그런 다음 a를 사용할 수 있습니다 로그 파일 분석기 깨진 링크 보고서를 생성합니다.
깨진 링크를 모니터링하는 효과적이고 장기적인 방법을 만들려면 다음을 수행하기 위해 CRON 작업을 설정할 수 있습니다.
- 사용
grep
서버 로그 파일에서 404 개의 항목이 포함 된 줄을 추출합니다. - 사용
sed
모든 라인에서 요청 된 URL 및 참조 업체 URL을 제외한 모든 것을 제거합니다. - 사용
sort
그리고uniq
목록에서 복제를 제거하는 명령. - 시간이 지남에 따라 변경 사항을 모니터링 할 수 있도록 결과를 매번 새 파일로 출력하십시오.
웹 서버 로그를 분석하고 404 페이지를 모두 찾으십시오. 그것은 훨씬 더 의미가 있고 훨씬 더 안정적입니다.
나는 이것이 오래된 질문이라는 것을 알고 있지만 GSA 관리 콘솔에서 내보내기 URL 기능을 사용한 다음 NOT_FOUND 상태의 URL을 찾을 수 있습니다. 이것은 GSA가 발견 한 모든 URL을 보여줄 것이지만 기어 다니려고 시도했을 때 404를 반환했습니다.