電子メールで引用されたテキストを識別するために、既存のツールやコード
-
22-08-2019 - |
質問
私は電子メールで引用されたテキストを識別するための方法を探しています。目標はメールハンドラボットを伴うGmailの私のWebアプリへの「ショー引用されたテキスト」機能の線に沿って何かを追加することです。
がありstackoverflowの上で同様の質問がありますが、それらは、アルゴリズムを求めています。私が持っている場合、私はこれを実装することができますが、私は非常にしようと、真の解決策を好むだろう。
要件:
1)HTMLとプレーンテキストの電子メールの両方をサポートしています。
を推測する必要はありません);2)(つまり、それはに対して引用されたテキストを比較するために、元のテキストを持っているフルスレッド上で動作します
3)「ブランドンが書い18:35で5月10日、2008年」のような一般的な引用関係の追加を処理します
Pythonライブラリは、超魔法の素晴らしい理想的であるが、私はその幸運を得ることを期待しないでください。これを行うことができ、簡単なコマンドラインツールは、理想にかなり近いだろうが、私はどちらかそれその幸運に期待しないでください。私は喜んツールに抽出するために、合理的に可能であるオープンソースのメールクライアントからよく知られて良いの実装に落ち着くと思います。
誰もが私の最善の策がどうなるかの提案を持っていますか?
私は、「電子メールハンドラボット構築キット」のようなものが存在しないことを一種の驚いてます。
解決
ただ、私はこの質問について、受信した電子メールのフォローアップます。
燮を理解することは非常に簡単/抽出/これを達成するためのロジックのビットを翻訳しています。私は、Pythonに関連する機能を移植し、私の目的のためにそれを微調整します。
燮はRubyで書かれた端末ベースのメールクライアントである: http://sup.rubyforge.org/
他のヒント
Googleは彼らの方法の特許を持っています: http://www.google.co.uk/patents/US7222299する