Stanford Pos Tagger em Java
-
21-09-2019 - |
Pergunta
Estou tentando o seguinte:
Sentence<TaggedWord> taggedString = MaxentTagger.tagStringTokenized("here is a string to tag");
O que me dá:
Erro: u nlp data post-tagger wsj3t0-18-left3words left3words-wsj-0-18.tagger (o sistema não consegue encontrar o caminho especificado)
Estou usando Stanford's Pos Tagger.
O que posso fazer para superar esse problema?
Solução
Parece que você primeiro precisa instanciar um tagger que passa pelo arquivo incluído:
new MaxentTagger("models/left3words-wsj-0-18.tagger");
O que é bastante desagradável, pois o método de marcação usado posteriormente é estático:
MaxentTagger.tagStringTokenized("here is a string to tag");
Eu também tive que passar -Xmx256m
Para fazê -lo executar com essa configuração.
Outras dicas
Está dizendo que não pode encontrar esse caminho. Então, ele existe em sua máquina?
Observe que as barras são barras de barriga - o seu retoque de suporte ao sistema operacional é um separador de arquivos?
Observe também que é um caminho absoluto - isso é pretendido?
Se tudo estiver ok, o arquivo existe?
EDIT: Caso contrário, você deve baixá -lo aqui (http://github.com/tiendung/ruby-nlp/blob/master/left3words-wsj-0-18.tager), coloque -o no caminho que o sistema está especificando e veja o que acontece.