Вопрос

Я ищу решение о Java для требования к анализу предложений для регистрации, будь то ключевое слово использовалось положительно или отрицательно.

Т.е. ключевое слово может быть «капусты» и предложение: -

«Мне нравятся кабины, но не горох

И я хотел бы, чтобы Java Text Analyzer какого-то типа, чтобы войти в систему, как положительно. Может ли библиотеки Lucene (Hibernate-Search) использовать для этого?

Есть предположения?

Это было полезно?

Решение

Вы ищете «анализ настроений». Одной из возможностей Лингпипе, кто любезно Ссылка на их конкуренты также. Отказ Джефф Далтон также имеет отличный список инструментов обработки натурального языка в его блог.

Другие советы

Я сомневаюсь, что есть что-то подобное. Луси определенно не может сделать это из коробки.

Как ты даже определять «Будь ли ключевым словом использована положительно или отрицательно» таким образом, чтобы его можно было оценить программно? Чтобы сделать это должным образом, вам придется проанализировать текст для своего фактического значения, который является проблемой AI, которая даже не решена дистанционно.

Я полагаю, что вы можете решить это примерно, просто делая статистический анализ того, выглядит ли ключевое слово, чаще близко к положительным (например, хорошим, отличным, замечательным) или отрицательным (плохой, ненависти, дерьмому, чертову) ключевые слова, но даже там, отрицания Структуры Sarcasm и сложные структуры предложений будут проблематичными.

Взгляни на Mahout вкус, который строит на Луче, но добавляет много того, что вам нужно из коробки. (редактировать) Я должен добавить, Mahout вкус просто Связанный к тому, что вы ищете, а не 100% матч.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top