Javaの名前付きエンティティ認識ライブラリ[終了]
-
06-07-2019 - |
質問
シンプルなものを探していますが、「十分」です。 Javaの名前付きエンティティ認識ライブラリ(および辞書)。メールとドキュメントを処理し、「基本情報」を抽出します。のような: 名前、場所、住所、日付
私は見回してきましたが、ほとんどがヘビーサイドであり、完全なNLPのようなプロジェクトです。
推奨事項
解決 2
ところで、最近 OpenCalais に出会いました。 >
他のヒント
以前の回答の1つをご覧になることをお勧めします。 同様の問題。
それ以外は、ほとんどの軽量のNERシステムは使用するドメインに大きく依存しています。たとえば、生物医学NERシステムに関するツールや論文がたくさんあります。以前の投稿(NERを実行する場合の主な推奨事項が既に含まれています)に加えて、さらに検討したいツールがいくつかあります。
- スタンフォードCER-NER
- Postech Biomedical NERシステムこの特定のドメインに興味がある
- OpenCalais は商用システムのようです。 OpenCalaisのUIMAラッパーがありますが、それらは時代遅れのようです。 UIMA用の辞書ベースのContext-Mapperアノテーターも役立ちます。 UIMAは学習曲線にかなりのオーバーヘッドを伴うことに注意してください;-)
- OpenNLP にもNERツールがあります。
- Balie は、特にNERも実行します。
- ABNER はNERを実行しますが、再び生物医学領域に焦点を当てています。
- ドイツのイェナ大学の JULIE Lab Tools もNERを行います。スタンドアロンバージョンとUIMA分析エンジンがあります。
1つの追加のコメント:入力をトークン化せずに逃げることはできません。自然言語のトークン化はわずかではありません。そのため、両方の機能を備えたツールボックスを使用することをお勧めします。
Alchemy API も試してみてください。 Open Calaisに似ています。
所属していません StackOverflow