Онлайн (предпочтительно) API поиска класса word

StackOverflow https://stackoverflow.com/questions/612102

  •  03-07-2019
  •  | 
  •  

Вопрос

У меня есть список слов, и я хочу отфильтровать его так, чтобы у меня были только существительные из этого списка слов (используя Java).Чтобы сделать это, я ищу простой способ запросить базу данных слов по их типу.

Мой вопрос в том, знает ли кто-нибудь о бесплатном, простом API поиска слов, который позволил бы мне найти класс слова, не обязательно его семантического определения.

Спасибо!

Ben.

Редактировать:Под классом слова я имел в виду "часть речи", спасибо, что прояснили это

Это было полезно?

Решение

Тип слова?Например, глагол, существительное, прилагательное и т.д.?Если это так, вы можете столкнуться с проблемой, заключающейся в том, что некоторые слова могут использоваться более чем одним способом.Например:"Вы можете обменять мне эту карточку?", "Это была неудачная сделка".

Видишь этот поток для некоторых предложений.

Взгляните на это кроме того, похоже, что это может сделать именно то, что вы ищете.

Другие советы

Я думаю, что то, что вы ищете, - это часть речи (POS) слова.В общем, это будет невозможно определить иначе, как в контексте предложения.Существует много слов , которые могут иметь несколько различных потенциальных частей речи (например"банк" может использоваться как глагол или существительное).

Вы могли бы использовать POS-теггер для получения нужной вам информации.Однако следующие теги частей речи предполагают, что вы помечаете слова внутри хорошо структурированного английского предложения...

  • В OpenNLP ( Открытый интерфейс ) Библиотеки Java, как правило, очень хороши и выпускаются под LGPL.В дистрибутив включен редактор тегов частей речи для английского и нескольких других языков.Просто перейдите на страницу проекта, чтобы получить jar (и не забудьте также загрузить модели).

  • Существует также Устройство для обозначения частей речи в Стэнфорде, написанный на Java под лицензией GPL.У меня не было никакого непосредственного опыта работы с этой библиотекой, но Стэнфордская лаборатория НЛП в целом довольно потрясающая.

Запрос к базе данных слов приведет к проблеме, которую Бен С.упоминания, напримерэто свинец (v.указывать путь) или вести (н.Пб).Если вы хотите потратить некоторое время на решение этой проблемы, посмотрите на пометку части речи.Там есть кое-какая хорошая информация в еще одна такая нить.

Для английского языка вы могли бы использовать WordNet с одним из доступные Java API чтобы найти лексическая категория слова (которое в НЛП чаще всего называют часть речи).Используя выделенный POS - маркировщик был бы еще один вариант.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top