Domanda

Sto cercando un modo per identificare il testo citato in messaggi di posta elettronica. L'obiettivo è quello di aggiungere qualcosa sulla falsariga di di Gmail "Mostra testo citato" caratteristica nel mio spazio web app che comporta un bot gestore di posta.

Non ci sono domande simili su StackOverflow, ma chiedono un algoritmo. Ho potuto implementare questa se devo, ma io preferisco di gran lunga una soluzione vero e provato.

Requisiti:

1) Sostenere le email di testo HTML a strisciamento

2) Funziona con l'intero thread (cioè, ha il testo originale per confrontare il testo citato contro, senza bisogno di indovinare)

3) Maniglie aggiunte quote legate comuni come "Il 10 maggio 2008 alle 18:35 Brandon ha scritto:"

Una libreria Python sarebbe super magicamente ideale impressionante, ma non aspettatevi di ottenere che fortunato. Un semplice strumento a riga di comando che può fare questo sarebbe abbastanza vicino a ideale, ma non mi aspetto che a quel fortunato sia. Mi piacerebbe molto stabilirsi su un noto buona implementazione da un client di posta elettronica open source che sarebbe ragionevolmente possibile estrarre in uno strumento.

Qualcuno ha un suggerimento che cosa la mia migliore possibilità sarebbe?

Sono un po 'sorpreso dal fatto che non esiste una cosa come un "e-mail del gestore bot kit di costruzione".

È stato utile?

Soluzione

Proprio seguito su una e-mail che ho ricevuto riguardo a questa domanda.

Sup ha una abbastanza facile da capire / estrarre / tradurre po 'di logica per realizzare questo. Ho portato le funzioni rilevanti per Python e ottimizzato per i miei scopi.

Sup è terminale basato su client di posta scritta in Ruby: http://sup.rubyforge.org/

Altri suggerimenti

Google ha un brevetto per il loro metodo: http://www.google.co.uk/patents/US7222299

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top