문제

사용자의 게시물을 분석하고 분류해야합니다. 예를 들어 : 모든 게시물을 텍스트를 기반으로 "구매"게시물 또는 "판매"게시물로 분류해야합니다. 팔다 내 집 "은"판매 "로 분류됩니다. 문제는 종종 그렇게 간단하지 않다는 것입니다."나는 오래된 집을 제거하려고합니다 "도"판매 "로 분류되어야합니다." 집 "은"구매 "가됩니다. 또한 해당 항목을 기반 으로이 게시물을 분류하고 싶습니다. 예를 들어 위의 게시물은"구매 "및"집 "으로 분류됩니다.

사용자 입력을 분석하고 이해할 때 좋은 접근 방식 / 좋은 프레임 워크 / 기술을 추천 할 수 있습니까? 감사.

도움이 되었습니까?

해결책

네가 옳아; 어려운 일입니다.

야후! a 용어 추출 사용할 수있는 API/웹 서비스. 그것은 백만 줄의 코드를 작성하지 않고 자신의 텍스트에서 언어 분석을 사용하는 꽤 좋은 방법입니다. 나는 그것을 사용하지 않았으므로 당신의 질문이 묻는 것처럼 그것이 비슷한 의미로 얼마나 잘 작동하는지 모르겠습니다.

다른 팁

당신이 말하는 것은 기본적으로 a입니다 베이지안 필터링 문제, 스팸 필터링에도 사용됩니다. 또한보십시오 이 대화. 합리적으로 복잡한 지역입니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top