Java テキスト分析ライブラリ
-
04-10-2019 - |
質問
キーワードが肯定的に使用されたか否定的に使用されたかを記録するために文章を分析するという要件に対する Java 駆動のソリューションを探しています。
つまり、キーワードは「キャベツ」と次の文です。
「キャベツは好きですが、エンドウ豆は好きではありません」
そして、何らかの種類の Java テキスト アナライザーがこれを肯定的なものとしてログに記録したいと考えています。lucene (Hibernate-Search) ライブラリをこれに利用できますか?
何かご意見は?
解決
「センチメント分析」を探しています。 1つの可能性は次のとおりです lingpipe, 、誰が親切に 競合他社にもリンクします. 。ジェフ・ダルトンには、自然言語処理ツールの素晴らしいリストもあります 彼のブログ.
他のヒント
そのようなものがあるとは思えません。ルーセンは間違いなく箱から出してはできません。
どうしますか 定義 プログラムで評価できる方法で「キーワードが積極的に使用されたのか否定的に使用されたのか」?それを適切に行うには、テキストを実際の意味について分析する必要があります。これは、リモートで解決さえさえされていないAIの問題です。
キーワードがポジティブ(良い、偉大、素晴らしい)またはネガティブ(悪い、憎しみ、くだらない、くそ)に近づくかどうかを統計的に分析するだけで、ほぼ解決できると思いますが、否定は否定です、皮肉と複雑な文の構造には問題があります。
を見てみましょう マウウトの味, 、ルーセンに基づいていますが、箱から出して必要なものの多くを追加します。 (編集)追加する必要があります、味は単に 関連している あなたが探しているものに、100%の一致ではありません。