なぜ私はあるはずのルートワードに従ってなかったポーターステムマーアルゴリズムの結果があるのですか?
-
12-10-2019 - |
質問
Porter Stemmerアルゴリズムを使用してアプリケーションでSTEM Wordを取得する必要がありますが、から得られるアルゴリズムをテストするときは http://www.tartarus.org/~martin/porterstemmer, 、茎の結果は、私に正しい茎の言葉を与えるものではありません。
解決
あなたから引用して リンク:
2.ステムマーが適切な言葉を生成しないのはなぜですか?
しばしば、茎を削除した後に茎のアルゴリズムが本当の言葉を残さないという粗いエラーであると見なされます。しかし、茎の目的は、単語を「パラダイム」形式にマッピングするのではなく、単語のバリアント形式を一緒にすることです。
そしてこれに関連して、
3.なぜエラーがあるのですか?
質問は通常、フォームにあります。なぜX2に抑制されると予想されていたのに、なぜ単語XをX1に抑える必要があるのでしょうか?茎のアルゴリズムが完全性を達成できないことを覚えておくことが重要です。バランスをとると、IRパフォーマンスが向上します(または可能性があります)が、個々の場合、エラーが何であるか、または何が何であるかがエラーを作成する場合があります。もちろん、これは、パフォーマンスを改善するためにSTEMMERに含まれる可能性のある追加のルールを示唆することとは異なる問題です。
所属していません StackOverflow