質問

私はnewsml(http://www.iptc.org/std/newsml-g2/2.7/examples/listing2_newsml-g2_complete.xml)をQueryPathで解析しようとしています。しかし、私はいくつかの要素のドットに問題があります。 <body.head>.

Firefox QueryPathプラグインでは、バックスラッシュでドットから逃れることができますが、PHP Pearライブラリではこれは機能しません。

何か案は?

(私は回避策ではなく、QueryPath内の解決策を探しています)

役に立ちましたか?

解決

過去には、きちんとしたPHP拡張機能(http://us3.php.net/manual/en/book.tidy.php)を使用して、QueryPathに渡す前にHTML/XMLをクリーンアップしました。

上記で参照したXMLはかなりきれいで、またかなり小さいです。

唯一の問題が要素名のドットである場合、正規式での前処理もおそらく機能します。そして、それは最速の解決策です。私はあなたができると思います preg_replace('/<body\./g', '<body-', $xml) そして、それを修正してもらいます。 (それは置き換えられます body.contentbody-content 等々。)

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top