QueryPathの問題のあるXMLを解析する（要素のドット）

https://stackoverflow.com/questions/6351004

28-10-2019
|

質問

私はnewsml（http://www.iptc.org/std/newsml-g2/2.7/examples/listing2_newsml-g2_complete.xml）をQueryPathで解析しようとしています。しかし、私はいくつかの要素のドットに問題があります。 <body.head>.

Firefox QueryPathプラグインでは、バックスラッシュでドットから逃れることができますが、PHP Pearライブラリではこれは機能しません。

何か案は？

（私は回避策ではなく、QueryPath内の解決策を探しています）

解決

過去には、きちんとしたPHP拡張機能（http://us3.php.net/manual/en/book.tidy.php）を使用して、QueryPathに渡す前にHTML/XMLをクリーンアップしました。

上記で参照したXMLはかなりきれいで、またかなり小さいです。

唯一の問題が要素名のドットである場合、正規式での前処理もおそらく機能します。そして、それは最速の解決策です。私はあなたができると思います preg_replace('/<body\./g', '<body-', $xml) そして、それを修正してもらいます。（それは置き換えられます body.content と body-content 等々。）

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow