Вопрос

Я заинтересован в разделе текстовая категоризация, используя libsvm. Как вы рекомендуете переводить условия / слова к численным данным, поэтому libsvm может понять это?

Спасибо!

Это было полезно?

Решение

В текстовых категоризации людей, как правило, создают гистограммы слов, используемых в домене, иногда они смотрят на комбинации двух слов и поставили на их гистограмму (это называется Bigrams). Но это действительно зависит от ваших данных и ваших целей.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top