センチメント分析(意見採掘)で最も困難な問題は何ですか?
-
24-10-2019 - |
質問
意見採掘/センチメント分析は、自然言語処理のやや最近のサブタスクです。テキスト分類と比較すると、より深い姿勢をとる人もいます。センチメント分析(意見採掘)で最も困難な問題についてどう思いますか?いくつか名前を付けてもらえますか?
解決
感情分析の重要な課題は次のとおりです。
1)名前付きエンティティ認識 - たとえば、300人のスパルタンがギリシャ人のグループまたは映画のグループであると実際に話している人は何ですか?
2)anaphora解像度 - 代名詞、または名詞句が言及するものを解決する問題。 「私たちは映画を見て夕食に行きました。ひどいものでした。」 「それ」は何を指しますか?
3)解析 - 文の主題と目的は何ですか?動詞および/または形容詞は実際に言及していますか?
4)皮肉 - 著者がわからない場合、「悪い」が悪いか良いかはわかりません。
5)Twitter-略語、首都の不足、スペルの悪さ、句読点の悪さ、文法の悪さ、...
他のヒント
HighteChriderは、センチメント分析の精度が改善を見ることができる領域であることに同意します。また、センチメント分析は、ほとんどの場合、閉じたドメインテキストで行われる傾向があると付け加えます。オープンドメインテキストでそれを行う試みは、通常、非常に悪い精度/F1メジャー/あなたが何を持っているか、または特定の文法構造のみを見るため、擬似オープンドメインであるものを巻き上げます。したがって、私は、文脈を特定し、それに基づいて意思決定を行うことができるトピックに敏感な感情分析と言えます。
また、Twitterから他のソーシャルメディアサイト(Facebook、YouTubeなど)に5番目のポイントを拡張します。
答えは、言語の複雑さ、文法の間違い、スペルだと思います。人々がそこに意見を表現する方法は非常に多くあります。たとえば、皮肉は非常に肯定的な感情として誤って解釈される可能性があります。
いくつかのタイプの感情分析(ドキュメントレベル、文レベル、比較感情分析など)にはいくつかのタイプがあり、各タイプにはいくつかの特定の問題があるため、問題はあまりにも一般的である可能性があります。
一般的に言えば、私は@ian Mercerの答えに同意します。他の3つの問題を追加します。
- より深い感情/感情を検出する方法。ポジティブとネガティブは非常に単純な分析であり、課題の1つは、意見の中にどれだけ憎しみがあるか、どれだけの幸福、どれだけの悲しみなどの感情を抽出するかです。
- 意見が肯定的であるオブジェクトと、意見が否定的であるオブジェクトを検出する方法。たとえば、「彼女が彼に勝った!」と言うと、これは彼女にとって前向きな感情と彼にとって否定的な感情を意味します。
- 非常に主観的な文章または段落を分析する方法。人間でさえ、この高い主観的なテキストの感情に同意することは非常に難しい場合があります。コンピューターを想像してみてください...