我有一个很大的文档,想对Python的文档进行淘汰,并在此文档的话语上进行阻止。有人知道这些货架包装吗?如果不是足够快的代码,也欢迎使用大型文档。谢谢

有帮助吗?

解决方案

NLTK 支持这一点。

其他提示

如果由于某种原因您不想使用NLTK,则可以尝试使用Pystemmer。对于停止单词,只需下载列表(Google IT)并将其过滤掉即可。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top