質問

シンプルなものを探していますが、「十分」です。 Javaの名前付きエンティティ認識ライブラリ(および辞書)。メールとドキュメントを処理し、「基本情報」を抽出します。のような: 名前、場所、住所、日付

私は見回してきましたが、ほとんどがヘビーサイドであり、完全なNLPのようなプロジェクトです。

推奨事項

役に立ちましたか?

解決 2

ところで、最近 OpenCalais に出会いました。 >

他のヒント

以前の回答の1つをご覧になることをお勧めします。 同様の問題。

それ以外は、ほとんどの軽量のNERシステムは使用するドメインに大きく依存しています。たとえば、生物医学NERシステムに関するツールや論文がたくさんあります。以前の投稿(NERを実行する場合の主な推奨事項が既に含まれています)に加えて、さらに検討したいツールがいくつかあります。

  • スタンフォードCER-NER
  • Postech Biomedical NERシステムこの特定のドメインに興味がある
  • OpenCalais は商用システムのようです。 OpenCalaisのUIMAラッパーがありますが、それらは時代遅れのようです。 UIMA用の辞書ベースのContext-Mapperアノテーターも役立ちます。 UIMAは学習曲線にかなりのオーバーヘッドを伴うことに注意してください;-)
  • OpenNLP にもNERツールがあります。
  • Balie は、特にNERも実行します。
  • ABNER はNERを実行しますが、再び生物医学領域に焦点を当てています。
  • ドイツのイェナ大学の JULIE Lab Tools もNERを行います。スタンドアロンバージョンとUIMA分析エンジンがあります。

1つの追加のコメント:入力をトークン化せずに逃げることはできません。自然言語のトークン化はわずかではありません。そのため、両方の機能を備えたツールボックスを使用することをお勧めします。

Alchemy API も試してみてください。 Open Calaisに似ています。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top