質問

私はやや大きなドキュメントを持っていて、Stop-Wordの排除を行い、Pythonを使用してこのドキュメントの単語に登場したいと考えています。これらの棚パッケージを知っている人はいますか?大規模なドキュメントに十分な速さであるコードもそうでない場合は、大歓迎です。ありがとう

役に立ちましたか?

解決

nltk これをサポートします。

他のヒント

何らかの理由でNLTKを使用したくない場合は、Ptystemmerを試すことができます。単語を停止するには、リスト(Google It)をダウンロードして除外してください。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top