命名的实体识别的图书馆Java[封闭]
-
06-07-2019 - |
题
我在寻找一个简单但是"足够好的"命名的实体识别的图书馆(和字典)java,我找到处理电子邮件和文件,并提取了一些"基本信息",如:人名、地名、地址和日期
我已经看,大多数似乎是重和充分自由党种项目。
任何建议?
解决方案 2
BTW,我最近遇到了 OpenCalais ,它似乎具有我正在照顾的功能。
其他提示
你可能会想看看一个的 我早些时候的答案 一个类似的问题。
此外,最轻的净入学率的系统取决于很多在该领域使用。你会发现一大堆的工具和论文有关生物医学净入学率的系统,例如。除了我先前的职位(其中已经包含了我的主要建议如果你想要做NER),这里有一些更多的工具你可能想看看入:
- 的 斯坦福大学CER-NER
- 的 浦项科技大学生物医学净入学率的系统 如果你有兴趣在这个特殊的领域
- OpenCalais 似乎是一个商业系统。还有 UIMA包装OpenCalais 但他们似乎过时。还有一个词典根据上下文映射器注释为UIMA,可以帮助你。要知道,UIMA意味着重要的开销在学习曲线;-)
- OpenNLP 还有一个净入学率的工具。
- Balie 不NER,太,除其他事项。
- 阿尔伯特 不NER,但再次关注在生物医学领域。
- 的 JULIE实验室工具 从耶拿大学、德国也做NER.他们有单独的版本和UIMA分析发动机。
一个附加说明:你不会得到没标记的输入。标记的自然语言稍非微不足道的,这就是为什么我建议你使用的工具箱,并两个你。
您可能还想尝试 Alchemy API 。它类似于Open Calais。
对于NLP语法,您可以查看 http://code.google.com/p/graph -expression / 和 http://gate.ac.uk/
不隶属于 StackOverflow