訂正既知のバイアスが収集したデータ
-
23-08-2019 - |
質問
ですが、ここで問題に類似私の問題(まえ、現実問題として以下に、この類推することにより理解).
私は不思議な両面コインだけがヘッド(ランダム)1 1,001投げ(残りはがしっぽ).言い換えれば、毎1,000尾一生懸命頑張りましたがあります1。
私は特有の疾患でみに1 1,000尾一生懸命頑張りましたかの通知毎にヘッド、それを私に気づき、表裏は±0.5℃です。もちろん、私が認識しこの病気やその効果だったので補正します。
人が現在与えられることになる新しいコイン、その気づヘッドは0.6.この病気は変わりません(だだ1 1,000尾)、どうやって計算が実際の比率の頭尾この新しいコインの生産?
Okなので何の問題なのか。なんてチームのデータの入力、出力を1と0.いを教えて機械学習アルゴリズムの予測は、予想出力(float0-1)与えられ入力します。問題は、1sは非常に少ないため、このネジの内部数学なっているので気の影響を大きく受ける丸め誤差で高精度の浮動小数点math.
そこで、正常にデータによるランダムに省略は0研修サンプルように表示されることがある程度の比率が1と0.もちろん、この機械学習アルゴリズムの出力は無く予測確率が打ち出されている。-の代わりに予測0.001にとってもプラスとなると、現在の予測±0.5℃です。
しか必要に変換し出力の機械学習アルゴリズムに戻る確率でのオリジナルの教育セットです。
著者注(2015-10-07): っとこの技術は通称"オンセット"
解決
きの計算は以下の
calculatedRatio = heads / (heads + tails / 1000)
とが必要
realRatio = heads / (heads + tails)
解決の両方程式のためのしっぽの利回りは以下の方程式です。
tails = 1000 / calculatedRatio - 1000
tails = 1 / realRatio - 1
合わせて利回り。
1000 / calculateRatio - 1000 = 1 / realRatio - 1
その解決のためのrealRatio.
realRatio = 1 / (1000 / calculatedRatio - 999)
るようです。calculatedRatio0.5利realRatio1/1001,0.6利回りは3/2003年.