カーネルがデータを直線的に分離可能にすることに成功していることをどのようにして知ることができますか?
-
16-10-2019 - |
質問
線形に分離可能なデータセットがあり、SVMSなどの機械学習アルゴリズムを使用している場合、カーネルを使用して 暗黙的に データポイントは、線形分離可能な機能空間にマップします。
しかし、カーネルが実際に持っているかどうかをどのように知ることができますか、 暗黙的に, 、データポイントを新機能空間で直線的に分離できるようにすることに成功しましたか?保証とは何ですか?
解決
これを保証することはできません。いくつかのデータ は 重複のためにカーネルで分離できません。
一生懸命努力することで、あなたはそうするでしょう オーバーフィッティングを引き起こします. 。基本的に、暗黙のマッピングを非常に複雑にするように強制し、トレーニングデータのコピーが含まれています(これは、RBFを使用して小さすぎる帯域幅を選択した場合に起こります)。
優れた一般化パフォーマンスが必要な場合は、いくつかのエラーに耐える必要があり、ソフトマージンやそのようなテクニックなどを使用する必要があります。
完璧な分離は目指すべきものではありません。このような保証は、過度に採用できることを保証するだけです!交差検証を使用して、過剰適合のリスクを減らし、トレーニングデータで最適であることと実際のパフォーマンスの間の適切なバランスを見つけます。
所属していません datascience.stackexchange