Alguna manera de eliminar los enlaces internos de los archivos XML de Wikipedia?
Pregunta
Si he descargado vertederos XML Wikipedia, ¿hay alguna manera de eliminar todos los enlaces internos dentro de un archivo XML?
Gracias
Solución
Una cosa que podría hacer, si se está importando en un wiki locales, es importar todos los archivos que desea, a continuación, utilizar un robot (por ejemplo. pywikipediabot es fácil de usar) para deshacerse de todos los enlaces internos.
Otros consejos
vertederos de base de datos de Wikipedia e información sobre el uso de ellos se encuentran aquí: Wikipedia: Base de Datos descarga . Usted debe hacer esto en lugar de escribir un guión para raspar Wikipedia.
Me gustaría tratar de utilizar XSLT para transformar el archivo XML en otro archivo XML.
Se puede hacer una búsqueda y reemplazo en su editor de texto favorito, reemplazando [[y]] sin nada.