我在寻找一个简单但是"足够好的"命名的实体识别的图书馆(和字典)java,我找到处理电子邮件和文件,并提取了一些"基本信息",如:人名、地名、地址和日期

我已经看,大多数似乎是重和充分自由党种项目。

任何建议?

有帮助吗?

解决方案 2

BTW,我最近遇到了 OpenCalais ,它似乎具有我正在照顾的功能。

其他提示

你可能会想看看一个的 我早些时候的答案 一个类似的问题。

此外,最轻的净入学率的系统取决于很多在该领域使用。你会发现一大堆的工具和论文有关生物医学净入学率的系统,例如。除了我先前的职位(其中已经包含了我的主要建议如果你想要做NER),这里有一些更多的工具你可能想看看入:

一个附加说明:你不会得到没标记的输入。标记的自然语言稍非微不足道的,这就是为什么我建议你使用的工具箱,并两个你。

您可能还想尝试 Alchemy API 。它类似于Open Calais。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top