문제

다음과 같은 양식으로 작성된 ARFF 파일이있을 수 있습니다.

@relation spamOrNot
@attribute body String
@attribute result {spam, notspam}
"free money now!", spam
"hi meet me at 10", notspam
.

와 나는 이걸로 이걸 실행하여 Weka에서 순진한 베이레스 분류자를 훈련 시켰습니다.이 숙련 된 분류자가 예측을 할 수 있도록 테스트 세트를 어떻게 만들어야합니까?고마워.

도움이 되었습니까?

해결책

스팸 및 스팸 방지 메일 예제 (실제 생활에서)를 찾을 수있는 많은 데이터 저장소가 있습니다.그런 다음 스팸 / 비 스팸 메일의 본문을 가져 와서 이와 같은 유사한 ARFF 파일을 만들어냅니다 (그러나이 시간은 스팸 메일 본문을위한 스팸 및 NOTSPAM의 스팸 메일 본문에 대한 스팸 파일을 테스트합니다).짐마자훈련 ARFF 파일을 사용하면 분류 자 모델을 얻을 수 있습니다.해당 모델을 저장하십시오.그런 다음 Weka Explorer Classify 탭에서 "테스트 세트"라디오 버튼을 선택하고 테스트 세트를 선택합니다 (레이블이 있음).그런 다음 교육 모델을로드하고 마우스 오른쪽 버튼을 클릭 한 다음 테스트 세트로 재평가를 선택하십시오.당신은 완료되었습니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top