regex / eclipseを使用してタグ(タグ自体を含む)間のすべてを削除する

StackOverflow https://stackoverflow.com/questions/2541676

  •  23-09-2019
  •  | 
  •  

質問

私は正規表現がどのように機能するかを理解するのはかなり慣れていませんが、これはただイライラしています。

たくさんのXMLドキュメントがたくさんありますdescription>blahblahblah</description>タグ。基本的にすべてのインスタンスを削除したい <description></description>.

私はEclipseを使用しており、オンラインで見つけたRegexの例をいくつか試しましたが、何も機能しません。

<description>(.*?)</description>

それはうまくいくべきではありませんか?

編集:

これが実際のコードです。

<description><![CDATA[<center><table><tr><th colspan='2' align='center'><em>Attributes</em></th></tr><tr bgcolor="#E3E3F3"><th>ID</th><td>308</td></tr></table></center>]]></description>

正しい解決策はありません

他のヒント

私はEclipseに精通していませんが、Javaの組み込みのRegexフレーバーを使用するRegex検索施設を期待しています。おそらく、「dotall」または「シングルライン」などというラベルの付いたボックスをチェックする必要があるか、対応するインライン修飾子を正規表現に追加することができます。

(?s)<description>(.*?)</description>

それはを許します . Newlinesに一致させるために、デフォルトではありません。

編集:これはそこにあります それは 内のnewlines <description> 要素は、あなたの正規表現が機能しない理由を考えることができる唯一の理由です。また、あなたが本当にregex検索をしていると思います。それは日食で自動的ですか、それとも正規表現と文字通りの検索を選択する必要がありますか?

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top