내 예감은 흠이 없습니다.사용될 수 있습을 추측 POS,태그를 파생시키는 순서와 태그의 최고 확률에 따라 사전 확률과 조건부 확률에서 토큰 하나 있습니다.
에 대한 완전한 명사 문구가 나지 않는 모델과 일치합니다.
모든 확률 기반으로 접근하는 것은 매우 어려울 것 기기 때문에,명사 문구를 포함할 수 있습 많습니다.이것이 정말로 많은합니다.유용한 훈련 확률,당신은 필요 정말 거대한 훈련합니다.
수도 있습 빠르고 쉽게 얻을 충분히 좋은 시작에 만들어 세트의 문법 규칙,예를 들어 정규 표현식을 통해 POS 태그하여 다음에서 설명
http://en.wikipedia.org/wiki/Noun_phrase#Components_of_noun_phrases
또는 다른 언어의 설명 문구를 명사.