最高の“ターンキー”ステミングアルゴリズム? [閉まっている]

StackOverflow https://stackoverflow.com/questions/226485

  •  03-07-2019
  •  | 
  •  

質問

現在取り組んでいるプロジェクトには、適切なステミングアルゴリズムが必要です。ポーターステマーを見ることが提案されました。ポーターステマーのページをチェックアウトしたとき、「Snowball」を支持して現在は廃止されていることがわかりました。ステマー。

優れたステマーが必要ですが、実際に自分の実装(または最適化)にかなりの時間を費やすことはできません。無料の無料のステマーである「既製」のベストは何ですか?リーズナブルな価格で利用できるフリーでないステマーはありますか?または、Snowballステマーが最善の策ですか?

役に立ちましたか?

解決

Porter2 ステマーは、私が選択したものです。ポーターステマーが標準であるように見えましたが、著者がこのページを見つけたときに、「Snowball(Porter2)」を勧めました。ステマー。このページにはCポートリンクがあります。

他のヒント

これは、実際にどのように適用するかによって異なります。 Natural Language Toolkit( http://nltk.sourceforge.net )には、いくつかのステマーが実装されています。ほとんどのアプリケーションを処理できるはずです。 Morphyステム機能が好きです。

もちろん、Pythonで使用できるため、別の言語で作業している場合は、常にコードを調べてアルゴリズムを収集し、選択した言語に転送できます。 Pythonは非常に読みやすいです。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top