문제

Wikipedia XML 덤프를 다운로드 한 경우 XML 파일 내에서 모든 내부 링크를 제거하는 방법이 있습니까?

감사

도움이 되었습니까?

해결책

당신이 할 수있는 한 가지는 로컬 위키로 가져 오는 경우 원하는 모든 파일을 가져온 다음 로봇을 사용하는 것입니다 (예 : Pywikipediabot 모든 내부 링크를 제거하기 위해 사용하기 쉽습니다).

다른 팁

Wikipedia 데이터베이스 덤프 및 사용에 대한 정보는 다음과 같습니다. Wikipedia : 데이터베이스 다운로드. Wikipedia를 긁어 내기 위해 스크립트를 작성하는 대신이 작업을 수행해야합니다.

XSLT를 사용하여 XML 파일을 다른 XML 파일로 변환하려고합니다.

좋아하는 텍스트 편집기에서 검색을 수행하고 [[및]]를 아무것도 대체 할 수 있습니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top