Pergunta

Eu estou procurando uma maneira de identificar texto citado em e-mails. O objetivo é adicionar algo ao longo das linhas de Gmails "Mostrar texto citado" recurso para meu aplicativo web que envolve um bot manipulador mail.

Existem perguntas semelhantes sobre stackoverflow, mas eles estão pedindo um algoritmo. Eu poderia implementar isso se eu tiver que, mas eu preferiria muito uma solução experimentada e verdadeira.

Requisitos:

1) Apoiar tanto e-mails de texto simples HTML e

2) Opera no segmento completo (ou seja, tem o texto original para comparar o texto citado contra, sem necessidade de adivinhar)

3) Alças adições citação relacionada comuns, tais como "10 Em maio de 2008 às 18:35 Brandon escreveu:"

Uma biblioteca python seria super magicamente ideal incrível, mas eu não espero que para obter essa sorte. Uma ferramenta de linha de comando simples que pode fazer isso seria muito próximo do ideal, mas eu não espero que essa sorte também. Eu me contentaria com prazer em uma boa implementação bem conhecido a partir de um cliente de email de código aberto que seria razoavelmente possível extrair em uma ferramenta.

Alguém tem uma sugestão que a minha melhor aposta seria?

Eu sou o tipo de surpresa que não há tal coisa como um "kit de construção manipulador de bot e-mail".

Foi útil?

Solução

Apenas acompanhamento de um e-mail que recebi sobre esta questão.

Sup tem um muito fácil de entender / extrato / traduzir pouco de lógica para fazer isso. Eu portado as funções relevantes para Python e tweaked-lo para os meus propósitos.

Sup é terminal baseado em cliente de email escrito em Ruby: http://sup.rubyforge.org/

Outras dicas

O Google tem uma patente para seu método: http://www.google.co.uk/patents/US7222299

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top