の探し方引用符内のタグ?
質問
い文字列のようになります:
This <span class="highlight">is</span> a very "nice" day!
何をすべき私のRegEx-正規表現のパターンVB見ていない場合には、引用符内のタグ?たいへ交換してください...
This <span class=^highlight^>is</span> a very "nice" day!
のようなもの <(")[^>]+> 動作しない:(
感謝
解決
これはあなたの正規表現の味に依存しますが、これはそれらのほとんどのために働くます:
"(?=[^<]*>)
の編集:これはどのように機能するか好奇心誰のためのの。これは、英語に翻訳「の前に>が続いている引用符を探す次の<」ます。
他のヒント
Regexes基本的には悪いで解析HTMLを参照 で提供するものはなぜ難しい構文解析XMLやHTML、regex? 理由).必要なものは、HTMLパーサです。見 では、例として構文解析HTMLお気に入りのパーサ? 例えば様々なparsers.
ご利用の場合VB.net 対応することができるでしょう利用 HTMLAgilityPack.
<span class="([^"]+?)?">
これを試してみてください
このタグであなたの最初の属性の値を取得する必要があります:
<[^">]+"(?<value>[^"]*)"[^>]*>
あなたの意図は、タグ内のすべての引用符を交換する場合、あなたは次の正規表現を使用することができます:
(<[^>"]*)(")([^>]*>)
あなたの引用符の前と後の部分文字列を分離すること。 は、これは開閉引用符に一致するようにしようとしないことに注意してください。これは単に、タグ内の引用符と一致しています。の
所属していません StackOverflow