객체 지향 베이지안 스팸 필터링?
-
08-06-2019 - |
문제
스팸 및 텍스트 분류를 위한 베이지안 필터링의 훌륭하고 깔끔한 객체 지향 프로그래밍(OOP) 구현이 있는지 궁금합니다.이것은 단지 학습 목적일 뿐입니다.
해결책
나는 확실히 추천한다 웨카 이는 오픈 소스 데이터 마이닝 소프트웨어 Java로 작성됨:
Weka는 데이터 마이닝 작업을 위한 기계 학습 알고리즘 모음입니다.알고리즘은 데이터 세트에 직접 적용하거나 자체 Java 코드에서 호출할 수 있습니다.Weka에는 데이터 전처리, 분류, 회귀, 클러스터링, 연관 규칙 및 시각화를 위한 도구가 포함되어 있습니다.또한 새로운 기계 학습 체계를 개발하는 데에도 적합합니다.
위에서 언급했듯이 다음과 같은 다양한 분류기가 함께 제공됩니다. SVM, 풍기다, C4.5, Naive Bayes(물론) 외 다수(참조: API 문서).많은 분류기가 다음과 같은 것으로 알려져 있습니다. Naive Bayes보다 훨씬 더 나은 성능 스팸 탐지 또는 텍스트 분류 분야에서.
게다가 Weka는 당신에게 매우 강력한 GUI…
다른 팁
6장을 확인하세요. 집단지성 프로그래밍
아마도 https://ci-bayes.dev.java.net/ 또는 http://www.cs.cmu.edu/~javabayes/Home/node2.html?
나도 그걸 가지고 놀아 본 적이 없습니다.
다음은 C#에서 베이지안 필터링을 구현한 것입니다. C#을 위한 순진한 베이지안 스팸 필터 (CodeProject에서 호스팅됨)
엔베이즈 - CodePlex에서 호스팅되는 또 다른 C# 구현
프랑스어로 되어 있지만 다운로드 링크를 찾을 수 있을 것입니다 :)PHP 순진한 베이지안 필터