質問

私は、そのような私はlibxml2のかMSHTMLを使用するときに何が起こるかのように、好ましくは完全にHTMLを書き換えることなく、C ++でHTMLにいくつかの簡単な修正を行う必要があります。

は、特に私が読んでできるようにする必要があり、その後、(潜在的に)、すべての「IMG」要素の「SRC」属性を変更します。私は有効なHTMLでこれを行うことができるように十分堅牢である必要があるが、好ましくは、プロセス内の他のHTMLのいずれかを変更することなくます。

これを処理することができるだろうそこに任意のライブラリはありますか?それともこれは私が正規表現で行うことができるものですか?私は正規表現をあまりにも精通していないよ、と私はあなたがHTMLを解析するためにそれらを使用しないでくださいと言うここに多くの質問を読んだが、それはこのようなものに適用される場合はその原則が適用されるかどうかは明確ではありませんよ主にHTMLからツリーを構築するのコンテキストでの解析に。

役に立ちましたか?

解決

彼らはよく、ネストされたタグを処理しないので、

正規表現は、HTMLのために推奨されていません。彼らは、この目的のために罰金する必要があります。

他のヒント

HTMLTidyする

を見て試してみてください

私は過去に類似のもののためにそれを使用しています。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top