문제

메일 본문의 내용인 텍스트 파일이 있습니다. HTML 코드가 포함되어 있습니다.

해당 텍스트 파일에서 href 태그만 가져오고 싶습니다. asp.net C# 웹 응용 프로그램을 사용하여 이 작업을 수행하고 싶습니다.

누구든지 나를 도와줄 코드가 있습니까?

감사해요

도움이 되었습니까?

해결책

사용해 보세요 HTML 민첩성 팩 이메일에서 HTML을 구문 분석하고 추출합니다. href <a> 태그의 속성.

HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(emailBody);
foreach (HtmlNode link in doc.DocumentNode.SelectNodes("//a[@href]"))
{
   HtmlAttribute att = link.Attributes["href"];
   string href = att.Value;
}

다른 팁

완벽한 해결책은 아니더라도 정규식을 사용할 수 있습니다.

class Program
{
    static void Main(string[] args)
    {
        var text = File.ReadAllText(@"d:\test.htm");

        Regex regex = new Regex("href\\s*=\\s*\"([^\"]*)\"", RegexOptions.IgnoreCase);
        MatchCollection matches = regex.Matches(text);
        foreach(Match match in matches)
        {
            Console.WriteLine(match.Groups[1]);
        }
    }
}
라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top