تصفية علامات الربط في السلسلة
سؤال
أحتاج إلى تصفية علامات الربط في السلسلة.على سبيل المثال،
Check out this site: <a href="http://www.stackoverflow.com">stackoverflow</a>
أحتاج أن أكون قادرًا على تصفية علامة الارتساء إلى هذا:
Check out this site: http://www.stackoverflow.com
قد لا يكون هذا التنسيق ثابتًا أيضًا.قد تكون هناك سمات أخرى لعلامة الارتساء.أيضًا، من الممكن أن يكون هناك أكثر من علامة ربط واحدة في السلسلة.أقوم بالتصفية في vb.net قبل الانتقال إلى قاعدة البيانات.
المحلول
إليك تعبيرًا عاديًا بسيطًا يجب أن يعمل.
Imports System.Text.RegularExpressions
' ....
Dim reg As New Regex("<a.*?href=(?:'|"")(.+?)(?:'|"").*?>.+?</a>")
Dim input As String = "This is a link: <a href='http://www.stackoverflow.com'>Stackoverflow</a>"
input = reg.Replace(input, "$1", RegexOptions.IgnoreCase)
لا تنتمي إلى StackOverflow