Question

J'ai un fichier texte, le contenu d'un mail body.it contient des codes HTML.

Je souhaite utiliser uniquement les balises href de ce fichier texte. Je souhaite effectuer cette opération avec l'application Web asp.net c #.

Quelqu'un a-t-il un code pour m'aider?

Merci

Était-ce utile?

La solution

Essayez d’utiliser le Pack d'agilité HTML pour analyser le code HTML de votre courrier électronique et extraire le fichier . href attributs de < a > tags.

HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(emailBody);
foreach (HtmlNode link in doc.DocumentNode.SelectNodes("//a[@href]"))
{
   HtmlAttribute att = link.Attributes["href"];
   string href = att.Value;
}

Autres conseils

Vous pouvez utiliser une expression régulière même s’il ne s’agit pas d’une solution parfaite:

class Program
{
    static void Main(string[] args)
    {
        var text = File.ReadAllText(@"d:\test.htm");

        Regex regex = new Regex("href\\s*=\\s*\"([^\"]*)\"", RegexOptions.IgnoreCase);
        MatchCollection matches = regex.Matches(text);
        foreach(Match match in matches)
        {
            Console.WriteLine(match.Groups[1]);
        }
    }
}
Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top