문제

스팸 및 텍스트 분류를 위한 베이지안 필터링의 훌륭하고 깔끔한 객체 지향 프로그래밍(OOP) 구현이 있는지 궁금합니다.이것은 단지 학습 목적일 뿐입니다.

도움이 되었습니까?

해결책

나는 확실히 추천한다 웨카 이는 오픈 소스 데이터 마이닝 소프트웨어 Java로 작성됨:

Weka는 데이터 마이닝 작업을 위한 기계 학습 알고리즘 모음입니다.알고리즘은 데이터 세트에 직접 적용하거나 자체 Java 코드에서 호출할 수 있습니다.Weka에는 데이터 전처리, 분류, 회귀, 클러스터링, 연관 규칙 및 시각화를 위한 도구가 포함되어 있습니다.또한 새로운 기계 학습 체계를 개발하는 데에도 적합합니다.

위에서 언급했듯이 다음과 같은 다양한 분류기가 함께 제공됩니다. SVM, 풍기다, C4.5, Naive Bayes(물론) 외 다수(참조: API 문서).많은 분류기가 다음과 같은 것으로 알려져 있습니다. Naive Bayes보다 훨씬 더 나은 성능 스팸 탐지 또는 텍스트 분류 분야에서.

게다가 Weka는 당신에게 매우 강력한 GUI

다른 팁

6장을 확인하세요. 집단지성 프로그래밍

아마도 https://ci-bayes.dev.java.net/ 또는 http://www.cs.cmu.edu/~javabayes/Home/node2.html?

나도 그걸 가지고 놀아 본 적이 없습니다.

다음은 C#에서 베이지안 필터링을 구현한 것입니다. C#을 위한 순진한 베이지안 스팸 필터 (CodeProject에서 호스팅됨)

엔베이즈 - CodePlex에서 호스팅되는 또 다른 C# 구현

프랑스어로 되어 있지만 다운로드 링크를 찾을 수 있을 것입니다 :)PHP 순진한 베이지안 필터

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top