Question

Je cherche un moyen d'identifier le texte cité dans les messages électroniques. L'objectif est d'ajouter quelque chose le long des lignes de Gmails « texte cité show » fonction à mon application web qui implique un bot de gestionnaire de courrier.

Il y a des questions similaires sur stackoverflow, mais ils demandent un algorithme. Je pourrais mettre en œuvre ce si je dois, mais je préfère grandement une solution éprouvée et vraie.

Exigences:

1) Soutenir les e-mails de texte HTML et clair

2) Fonctionne sur le fil complet (qui est, il a le texte original de comparer le texte cité contre, pas besoin de deviner)

3) Poignées ajouts liés à la quote-communs tels que « Le 10 mai 2008 à 18:35 Brandon a écrit: »

Une bibliothèque Python serait super magie idéal génial, mais je ne vous attendez pas à obtenir cette chance. Un simple outil de ligne de commande qui peut faire cela assez proche de l'idéal, mais je ne vous attendez pas à ce que ce soit la chance. Je serais heureux contenterais sur une bonne mise en œuvre bien connue d'un client de messagerie open source qui serait raisonnablement possible d'extraire un outil.

Quelqu'un at-il une suggestion que mon meilleur pari serait?

Je suis un peu surpris qu'il n'y ait pas une telle chose comme un « gestionnaire email bot kit de construction ».

Était-ce utile?

La solution

Pour faire suite à un courriel que je reçus au sujet de cette question.

Sup a une assez facile à comprendre / extrait / traduire peu de logique pour y parvenir. Je les fonctions pertinentes porté à Python et peaufiné pour mes besoins.

Sup est client de messagerie basé terminal écrit en Ruby: http://sup.rubyforge.org/

Autres conseils

Google a un brevet pour leur méthode: http://www.google.co.uk/patents/US7222299

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top