NLP:질적으로"긍정적인"vs"부정적인 문장"

https://stackoverflow.com/questions/122595

02-07-2019
|

문제

나는 당신의 도움이 필요합을 결정하는 최고의 접근 방식에 대한 분석이 산업별 문장을(즉영화 리뷰)"에 대한 긍정적인"vs"부정적인".본 라이브러리 등과 같은 OpenNLP 기 전에,하지만 너무 낮은 수준의-그것은 단지 나에게 기본적인 문장 구성,내가 무엇이 필요한 것은 더 높은 수준의 구조의:-희망을 가진 단어 목록 -희망 학습 가능한에서 내 데이터 세트

감사합니다!

해결책

무엇을 찾고 당신은 일반적으로 더빙 감성 분석.일반적으로,심리를 분석하지 않을 처리할 수 있 섬세한 미묘한 차이를,다음과 같이 풍자 또는 아이러니,하지만 요금은 꽤 잘하는 경우에 당신을 던져 대량의 데이터습니다.

심리 분석은 일반적으로 필요 아주 조금의 사전 처리합니다.최소 토큰화,문장의 경계 검출 및 음성 부분을 줍니다.때때로,구문 분석 중요 할 수 있습니다.그 일을 제대로 전체 지점의 연구에서는 전산 언어학,그리고 내가 권하고 싶지 않으로 당신과 함께 오는 당신의 자신의 솔루션을지 않는 한 당신이 당신의 시간을 연구하는 분야 처음이다.

OpenNLP 는 몇 가지 도구를 원조하는 감성 분석,하지만 당신이 원하는 무언가가 더 심각해야 합로 LingPipe 구하지 않습니다.그것은 몇 가지 기본 제공 SA-기능성과 좋 튜토리얼.훈련할 수 있는 당신의 자신에 그것을 설정 데이터,하지만 생각하지 않아요 완전히 사소한:-).

인터넷 검색에 대한 기간은 아마도 당신이 일부 자원을 작동합니다.만약 당신이 더 이상 특정한 질문,요청,나를 보 nlp 태그 밀접하게;-)

다른 팁

감정 분석에 대한 일부 접근법은 다른 텍스트 분류 작업에서 인기있는 전략을 사용합니다. 필름 검토를 단어 벡터로 변환하고 교육 데이터로 분류기 알고리즘에 공급하는 가장 일반적입니다. 가장 인기있는 데이터 마이닝 패키지가 여기에서 도움이 될 수 있습니다. 당신은 이것을 볼 수 있습니다 감정 분류에 대한 튜토리얼 오픈 소스를 사용하여 실험을 수행하는 방법 설명 RapidMiner 툴킷.

또한 a 좋은 데이터 세트 영화 리뷰에 대한 의견을 탐지하는 것과 관련된 연구 목적으로 제공됩니다. IMDB 사용자 리뷰를 기반으로하며 많은 것을 확인할 수 있습니다. 관련 연구 작업 해당 지역 및 데이터 세트 사용 방법.

이러한 방법의 효과는 통계적 관점에서만 판단 될 수 있다는 점을 염두에두고 있습니다. 따라서 의견이 감지하기 어려운 오 분류 및 사례가 있다고 가정 할 수 있습니다. 이 실에서 이미 알 수 있듯이 아이러니와 풍자와 같은 것을 감지하는 것은 실제로 매우 어려울 수 있습니다.

라이센스 : CC-BY-SA ~와 함께 속성

제휴하지 않습니다 StackOverflow