Meu palpite é que um HMM não é o modelo certo. Ele pode ser usado para adivinhar as tags POS, derivando a sequência de tags com as mais altas probabilidades com base em probabilidades anteriores e probabilidades condicionais de um token para o outro.
Para uma frase de substantivo completa, não vejo como esse modelo corresponde.
Qualquer abordagem baseada em probabilidade será muito difícil de treinar, porque as frases substantivas podem conter muitos tokens. Isso contribui para muitas combinações. Para obter probabilidades úteis de treinamento, você precisa de grandes conjuntos de treinamento.
Você pode obter um começo suficientemente bom suficiente ao criar um conjunto de regras gramaticais, por exemplo, expressões regulares, sobre tags de POS seguindo a descrição em
http://en.wikipedia.org/wiki/noun_phrase#components_of_noun_phrases
ou qualquer outra descrição linguística das frases substantivas.