Ruby:英語の不規則な動詞を「知っている」ステマーはありますか?

StackOverflow https://stackoverflow.com/questions/4501435

  •  12-10-2019
  •  | 
  •  

質問

Ruby Stemmerがあります https://github.com/aurelian/ruby-stemmer, 、しかし、それは1)英語の不規則な動詞を抑制しません2)Windowsでネイティブ拡張機能を構築できません。少なくとも1つの問題を修正する代替手段はありますか?

役に立ちましたか?

解決

ステムマー(通常は単語の端から外れているだけ)ではなく、lemmatizer(形態に関する情報があり、不規則な言葉を処理できる)を探しているべきだと思います。見る この説明 Manning、Raghavan、およびSchützeのオンラインブックに関する情報検索。

私はそれを試していませんが、Rubyのこの英語のレマティザーに簡単な検索が出会いました: エレマ.

レンマ化を行うことができる一般的に使用されている(普通の)英語の形態分析装置は モルファ.

他のヒント

ステムマーはどれも英語で不規則な動詞を処理することはできません。

  • https://github.com/ealdent/uea-systemer - 純粋なルビー、よく書かれた、2009年、ドキュメントはほとんどありませんが、他のドキュメントよりも少しありますが、Windows OKにインストールされます
  • https://github.com/romanbsd/fast-stemmer 純粋なCは、読みにくい、他の人よりも速くなるはずです(パフォーマンスをテストしませんでした)、2009年から非常に最小限のドキュメントを持ち、Windows OKにインストールします。 メソッドには副作用があります。コピーを作成するように注意してください
  • https://github.com/aurelian/ruby-stemmer 2010年、Windowsでネイティブ拡張機能を構築できません。英語を除く他のヨーロッパの言語を扱うことができます
  • http://rubyforge.org/projects/stemmer Pure Rubyは2006年以来更新されておらず、ドキュメントがありません。WindowsにOKをインストールしています。
  • http://rubyforge.org/projects/stemmer4r - ドキュメントなし、2005年。試してみませんでした

ルビーベースのNLPのグーグルでこれを見つけました http://mendicantbug.com/2009/09/13/nlp-resources-for-ruby/

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top