Стэнфордский POS - теггер на Java
-
21-09-2019 - |
Вопрос
Я пытаюсь это:
Sentence<TaggedWord> taggedString = MaxentTagger.tagStringTokenized("here is a string to tag");
что дает мне:
Ошибка:\u\ nlp\data\pos-tagger\wsj3t0-18-left3words\left3words-wsj-0-18.tagger (Система не может найти путь указанный)
Я использую стэнфордский POS - маркировщик.
Что я могу сделать, чтобы преодолеть эту проблему?
Решение
Похоже, сначала вам нужно создать экземпляр теггера, передающий включенный файл:
new MaxentTagger("models/left3words-wsj-0-18.tagger");
Что довольно неприятно, поскольку метод пометки, используемый позже, является статическим:
MaxentTagger.tagStringTokenized("here is a string to tag");
Я тоже должен был пройти -Xmx256m
чтобы заставить его работать с этой настройкой.
Другие советы
Это говорит о том, что он не может найти этот путь.Итак, существует ли он на вашем компьютере?
Обратите внимание, что косые черты являются обратными - поддерживает ли ваша ОС обратную косую черту в качестве разделителя файлов?
Также обратите внимание, что это абсолютный путь - так ли это задумано?
Если все остальное в порядке, существует ли этот файл?
Редактировать:если нет, вам следует скачать его здесь (http://github.com/tiendung/ruby-nlp/blob/master/left3words-wsj-0-18.tagger), поместите его в путь, который указывает система, и посмотрите, что произойдет.