ウェカのサンプルに関する調査に関する初心者の質問

https://stackoverflow.com/questions/3723219

03-10-2019
|

質問

Wekaを使用して、「分類」タグでSVM分類子をトレーニングしました。今、私はどのデータサンプルが誤分類されているかをさらに調査したいと思います。私は彼らのパターンを研究する必要がありますが、Wekaからこれをどこで見るかはわかりません。誰かが私に助けてくれませんか？前もって感謝します。

解決

からのオプションを有効にすることができます：

alt text

次のインスタンスの予測を取得します。

=== Predictions on test split ===

 inst#     actual   predicted  error prediction
   1   2:Iris-ver  2:Iris-ver         0.667 
  ...
  16   3:Iris-vir  2:Iris-ver   +     0.667

編集

コメントで説明したように、あなたは StratifiedRemoveFolds フィルタリングしてデータを手動で分割し、交差検証の10倍を作成します。

これプライマー Weka Wikiからは、コマンドラインからWekaを呼び出す方法の例がいくつかあります。これがサンプルバッシュスクリプトです：

#!/bin/bash

# I assume weka.jar is on the CLASSPATH

# 10-folds CV
for f in $(seq 1 10); do
    echo -n "."

    # create train/test set for fold=f
    java weka.filters.supervised.instance.StratifiedRemoveFolds -i iris.arff \
        -o iris-f$f-train.arff -c last -N 10 -F $f -V
    java weka.filters.supervised.instance.StratifiedRemoveFolds -i iris.arff \
        -o iris-f$f-test.arff -c last -N 10 -F $f

    # classify using SVM and store predictions of test set
    java weka.classifiers.functions.SMO -C 1.0 \
        -K "weka.classifiers.functions.supportVector.RBFKernel -G 0.01" \
        -t iris-f$f-train.arff -T iris-f$f-test.arff \
        -p 0 > f$f-pred.txt
        #-i > f$f-perf.txt
done
echo

各折り目について、これにより2つのデータセット（トレーニング/テスト）が作成され、予測もテキストファイルに保存されます。そうすれば、各インデックスをテストセットの実際のインスタンスと一致させることができます。

もちろん、あなたが望むなら、GUIでも同じことができます（もう少し退屈です！）

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow