ウィキペディアのXMLファイルからの内部リンクを除去する何らかの方法?

StackOverflow https://stackoverflow.com/questions/703399

  •  22-08-2019
  •  | 
  •  

質問

私は、ウィキペディアのXMLダンプをダウンロードした場合は、

、XMLファイル内から内部リンクのすべてを除去する方法はありますか?

おかげ

役に立ちましたか?

解決

あなたは地元のwikiにそれらをインポートする場合は、

あなたができることの一つは、ロボット(例えばを使用し、その後、必要なすべてのファイルをインポートすることです。<のhref = "http://pywikipediabot.sourceforge.net/ 「REL =」nofollowをnoreferrer "> pywikipediabot のは、すべての内部リンクを取り除くために)使いやすいです。

他のヒント

ウィキペディアのデータベースのダンプとそれらの使用についての情報はここにあります:ウィキペディア:データベースのダウンロード。あなたが代わりにウィキペディアをこすりするためのスクリプトを書くのにこれを行う必要があります。

私は別のXMLファイルにXMLファイルを変換するためにXSLTを使用しようとします。

あなたは何もして、[[と]]の交換、お好みのテキストエディタで検索を行うと置き換えることができます。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top