我有一个单词列表,我想对其进行过滤,以便我只拥有该单词列表中的名词(使用 Java)。为此,我正在寻找一种简单的方法来查询单词数据库的类型。

我的问题是有人知道一个免费、简单的单词查找 API 可以让我找到 班级 一个词的含义,不一定是它的语义定义。

谢谢!

本.

编辑:就单词类别而言,我的意思是“词性”,感谢您澄清这一点

有帮助吗?

解决方案

单词类型?如动词,名词,形容词等?如果是这样,您可能会遇到一些问题,即某些单词可以以多种方式使用。例如:“你可以换我这张卡吗?”,“这是一个糟糕的交易。”

请参阅此主题以获取一些建议。

看看这个,看起来它可能完全与你有关。寻找。

其他提示

我认为您正在寻找的是单词的词性(POS)。一般来说,除非在句子的上下文中,否则不可能确定。有许多单词可以有几个不同的潜在词性(例如:“银行”可以用作动词或名词)。

您可以使用词性标注器来获取您想要的信息。但是,以下词性标记器假设您正在结构良好的英语句子中标记单词......

  • 开放式自然语言处理 Java 库通常都非常好并且在 LGPL 下发布。发行版中包含英语和其他几种语言的词性标注器。只需转到项目页面即可获取 jar(并且不要忘记也下载模型)。

  • 还有 斯坦福词性标注器, ,在 GPL 下用 Java 编写。我没有直接体验过这个库,但斯坦福 NLP 实验室总体来说非常棒。

查询单词数据库将导致Ben S.提到的问题,例如:它是铅(v。显示方式)还是铅(n.PB)。如果您想花一些时间来解决问题,请查看词性标注。 另一个SO主题中有一些很好的信息。

对于英语,您可以将WordNet与可用的Java API 中的一个一起使用来查找词汇类别一词(在NLP中最常被称为词性) )。使用专用的 POS标记器将是另一种选择。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top