私の予想は、うーんが適切なモデルではないということです。これは、1つのトークンから次のトークンまでの事前の確率と条件付き確率に基づいて最高の確率を持つタグのシーケンスを導き出すことにより、POSタグを推測するために使用できます。
完全な名詞句については、このモデルがどのように一致するかわかりません。
名詞句には多くのトークンが含まれる可能性があるため、確率に基づいたアプローチは非常に困難です。これにより、非常に多くの組み合わせが可能になります。有用なトレーニング確率を得るには、本当に巨大なトレーニングセットが必要です。
記述に従って、POSタグを介して、通常の表現などの文法ルールのセットを作成することから、すぐに簡単に良いスタートを切ることができます。
http://en.wikipedia.org/wiki/noun_phrase#components_of_noun_phrases
または名詞句の他の言語の説明。