QueryPathの問題のあるXMLを解析する(要素のドット)
質問
私はnewsml(http://www.iptc.org/std/newsml-g2/2.7/examples/listing2_newsml-g2_complete.xml)をQueryPathで解析しようとしています。しかし、私はいくつかの要素のドットに問題があります。 <body.head>
.
Firefox QueryPathプラグインでは、バックスラッシュでドットから逃れることができますが、PHP Pearライブラリではこれは機能しません。
何か案は?
(私は回避策ではなく、QueryPath内の解決策を探しています)
解決
過去には、きちんとしたPHP拡張機能(http://us3.php.net/manual/en/book.tidy.php)を使用して、QueryPathに渡す前にHTML/XMLをクリーンアップしました。
上記で参照したXMLはかなりきれいで、またかなり小さいです。
唯一の問題が要素名のドットである場合、正規式での前処理もおそらく機能します。そして、それは最速の解決策です。私はあなたができると思います preg_replace('/<body\./g', '<body-', $xml)
そして、それを修正してもらいます。 (それは置き換えられます body.content
と body-content
等々。)
所属していません StackOverflow