停止词消除和茎中的python
-
28-09-2019 - |
题
我有一个很大的文档,想对Python的文档进行淘汰,并在此文档的话语上进行阻止。有人知道这些货架包装吗?如果不是足够快的代码,也欢迎使用大型文档。谢谢
解决方案
NLTK 支持这一点。
其他提示
如果由于某种原因您不想使用NLTK,则可以尝试使用Pystemmer。对于停止单词,只需下载列表(Google IT)并将其过滤掉即可。
不隶属于 StackOverflow
题
我有一个很大的文档,想对Python的文档进行淘汰,并在此文档的话语上进行阻止。有人知道这些货架包装吗?如果不是足够快的代码,也欢迎使用大型文档。谢谢
解决方案
NLTK 支持这一点。
其他提示
如果由于某种原因您不想使用NLTK,则可以尝试使用Pystemmer。对于停止单词,只需下载列表(Google IT)并将其过滤掉即可。