Wikipedia XML 파일에서 내부 링크를 제거하는 어쨌든?
문제
Wikipedia XML 덤프를 다운로드 한 경우 XML 파일 내에서 모든 내부 링크를 제거하는 방법이 있습니까?
감사
해결책
당신이 할 수있는 한 가지는 로컬 위키로 가져 오는 경우 원하는 모든 파일을 가져온 다음 로봇을 사용하는 것입니다 (예 : Pywikipediabot 모든 내부 링크를 제거하기 위해 사용하기 쉽습니다).
다른 팁
Wikipedia 데이터베이스 덤프 및 사용에 대한 정보는 다음과 같습니다. Wikipedia : 데이터베이스 다운로드. Wikipedia를 긁어 내기 위해 스크립트를 작성하는 대신이 작업을 수행해야합니다.
XSLT를 사용하여 XML 파일을 다른 XML 파일로 변환하려고합니다.
좋아하는 텍스트 편집기에서 검색을 수행하고 [[및]]를 아무것도 대체 할 수 있습니다.
제휴하지 않습니다 StackOverflow