题
我要寻找一种方法来识别邮件引用文本。我们的目标是要沿着Gmail的“显示引用的文字”功能,我的web应用程序的其中涉及的邮件处理BOT行补充一下。
有计算器上类似的问题,但他们所要求的一种算法。我可以实现这一点,如果我必须这样做,但我会非常喜欢一个尝试和真正的解决方案。
要求:
1)支持HTML和纯文本电子邮件
2)的全螺纹上操作(即,它具有原始文本进行比较的引用文字;无需猜)
3)处理常见的报价相关的补充,如“在2008年5月10日在下午6时35分布兰登写道:”
一个Python库将是超级神奇真棒理想,但我不希望得到那个幸运。一个简单的命令行工具,它可以这样做会很接近理想,但我不希望到那个幸运的要么。我很高兴地解决从一个开源邮件客户端的一个众所周知的良好的执行这将是合理的可能提取到的工具。
有没有人有一个建议,就是我最好的选择会是什么?
我有点惊讶的是,有作为“的电子邮件处理BOT建设套件。”
没有这样的事解决方案
刚上我收到关于这个问题的电子邮件跟进。
燮具有很容易理解/提取/完成这种翻译逻辑的位。我移植的相关功能,Python和调整了它为我的目的。
燮是Ruby编写的基于终端的邮件客户端: http://sup.rubyforge.org/
其他提示
谷歌有他们的方法的专利: http://www.google.co.uk/patents/US7222299
不隶属于 StackOverflow