Pythonのストップワードの除去とStemmer
-
28-09-2019 - |
質問
私はやや大きなドキュメントを持っていて、Stop-Wordの排除を行い、Pythonを使用してこのドキュメントの単語に登場したいと考えています。これらの棚パッケージを知っている人はいますか?大規模なドキュメントに十分な速さであるコードもそうでない場合は、大歓迎です。ありがとう
解決
nltk これをサポートします。
他のヒント
何らかの理由でNLTKを使用したくない場合は、Ptystemmerを試すことができます。単語を停止するには、リスト(Google It)をダウンロードして除外してください。
所属していません StackOverflow