Pregunta

Si he descargado vertederos XML Wikipedia, ¿hay alguna manera de eliminar todos los enlaces internos dentro de un archivo XML?

Gracias

¿Fue útil?

Solución

Una cosa que podría hacer, si se está importando en un wiki locales, es importar todos los archivos que desea, a continuación, utilizar un robot (por ejemplo. pywikipediabot es fácil de usar) para deshacerse de todos los enlaces internos.

Otros consejos

vertederos de base de datos de Wikipedia e información sobre el uso de ellos se encuentran aquí: Wikipedia: Base de Datos descarga . Usted debe hacer esto en lugar de escribir un guión para raspar Wikipedia.

Me gustaría tratar de utilizar XSLT para transformar el archivo XML en otro archivo XML.

Se puede hacer una búsqueda y reemplazo en su editor de texto favorito, reemplazando [[y]] sin nada.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top