質問

私は自然言語処理のために多くの異なるコーパスを利用しており、WordNet Word Sensesで注釈が付けられたコーパスを探しています。

コーパスを手動で構築する必要があるため、おそらくこの情報に大きなコーパスはないことを理解していますが、何かを避けるべきものが必要です。

また、コーパスが存在していない場合、少なくとも感覚注釈付きNGRAMデータベースがあります(単語がそれぞれの定義のそれぞれの時間、または単語の感覚の一般的なものに応じて各ワードネット定義の数値がありますは)?

役に立ちましたか?

解決

WordNetに注釈が付けられた3つの著名なコーパス:

他のヒント

いくつかの Senseval (今 semeval)データにWordNetが注釈が付けられています。

Senseval2を使用できます。Javaには、Semcor形式と(JSemcor API)、およびSenseval3もあります。これらの2つのコーパスは、単語感覚の乱用に使用されます。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top