문제
메일 본문의 내용인 텍스트 파일이 있습니다. HTML 코드가 포함되어 있습니다.
해당 텍스트 파일에서 href 태그만 가져오고 싶습니다. asp.net C# 웹 응용 프로그램을 사용하여 이 작업을 수행하고 싶습니다.
누구든지 나를 도와줄 코드가 있습니까?
감사해요
해결책
사용해 보세요 HTML 민첩성 팩 이메일에서 HTML을 구문 분석하고 추출합니다. href <a> 태그의 속성.
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(emailBody);
foreach (HtmlNode link in doc.DocumentNode.SelectNodes("//a[@href]"))
{
HtmlAttribute att = link.Attributes["href"];
string href = att.Value;
}
다른 팁
완벽한 해결책은 아니더라도 정규식을 사용할 수 있습니다.
class Program
{
static void Main(string[] args)
{
var text = File.ReadAllText(@"d:\test.htm");
Regex regex = new Regex("href\\s*=\\s*\"([^\"]*)\"", RegexOptions.IgnoreCase);
MatchCollection matches = regex.Matches(text);
foreach(Match match in matches)
{
Console.WriteLine(match.Groups[1]);
}
}
}
제휴하지 않습니다 StackOverflow