在保留尽可能多的布局(包括缩进和注释)的同时,您将使用什么来更改XML文件?

我的问题是我有几个大量的手工编辑的XML文件描述了用户界面,现在我需要将几个属性翻译成另一种语言。

我尝试过使用Python + ElementTree,但它既不保留空格也不保留注释。

我已经看到XSLT被建议用于类似的问题,但我不认为在这种情况下这是一个替代方案,因为我需要为每个属性做一些逻辑和查找。

最好还保留每个元素中的属性顺序,但我可以容忍更改的顺序。

有帮助吗?

解决方案

任何DOM操作模块都应该满足您的需求。布局只是一个文本数据,因此它在DOM中表示为文本节点:

>>> from xml.dom.minidom import parseString
>>> dom = parseString('''\
... <message>
...   <text>
...     Hello!
...   </text>
... </message>''')
>>> dom.childNodes[0].childNodes
[<DOM Text node "u'\n  '">, <DOM Element: text at 0xb765782c>, <DOM Text node "u'\n'">]
>>> text = dom.getElementsByTagName('text')[0].childNodes[0]
>>> text.data = text.data.replace(u'Hello', u'Hello world')
>>> print dom.toxml()
<?xml version="1.0" ?><message>
  <text>
    Hello world!
  </text>
</message>

其他提示

如果您使用的是XSLT处理器,例如 xt ,那么您可以编写扩展程序Java中可以执行任何需要的任意转换的方法。

话虽如此,我使用了Python的 xml.dom.minidom 模块成功进行此类转换。它确实保留了空白和布局。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top