質問
Wekaを使用して、「分類」タグでSVM分類子をトレーニングしました。今、私はどのデータサンプルが誤分類されているかをさらに調査したいと思います。私は彼らのパターンを研究する必要がありますが、Wekaからこれをどこで見るかはわかりません。誰かが私に助けてくれませんか?前もって感謝します。
解決
からのオプションを有効にすることができます:
次のインスタンスの予測を取得します。
=== Predictions on test split ===
inst# actual predicted error prediction
1 2:Iris-ver 2:Iris-ver 0.667
...
16 3:Iris-vir 2:Iris-ver + 0.667
編集
コメントで説明したように、あなたは StratifiedRemoveFolds フィルタリングしてデータを手動で分割し、交差検証の10倍を作成します。
これ プライマー Weka Wikiからは、コマンドラインからWekaを呼び出す方法の例がいくつかあります。これがサンプルバッシュスクリプトです:
#!/bin/bash
# I assume weka.jar is on the CLASSPATH
# 10-folds CV
for f in $(seq 1 10); do
echo -n "."
# create train/test set for fold=f
java weka.filters.supervised.instance.StratifiedRemoveFolds -i iris.arff \
-o iris-f$f-train.arff -c last -N 10 -F $f -V
java weka.filters.supervised.instance.StratifiedRemoveFolds -i iris.arff \
-o iris-f$f-test.arff -c last -N 10 -F $f
# classify using SVM and store predictions of test set
java weka.classifiers.functions.SMO -C 1.0 \
-K "weka.classifiers.functions.supportVector.RBFKernel -G 0.01" \
-t iris-f$f-train.arff -T iris-f$f-test.arff \
-p 0 > f$f-pred.txt
#-i > f$f-perf.txt
done
echo
各折り目について、これにより2つのデータセット(トレーニング/テスト)が作成され、予測もテキストファイルに保存されます。そうすれば、各インデックスをテストセットの実際のインスタンスと一致させることができます。
もちろん、あなたが望むなら、GUIでも同じことができます(もう少し退屈です!)
所属していません StackOverflow