質問

最近、顔認識を少し見ました。しかし、私はあるアルゴリズムの数にあふれています。

PCA、LDA、IDA、GABOR WAVELETS、AAM ...

あなたがのようなものを作りたかったと言ってください これ...どのアルゴリズムを使用しますか、それともどの論文を読みますか?

役に立ちましたか?

解決

最初にすべきことは、リストしたアルゴリズムが顔認識のさまざまな段階で使用されていることを認識することだと思います。

まず、表現、つまり使用する機能を決定する必要があります。これらは、生のピクセル、Gaborフィルター、いくつかの種類の形状記述子、変形可能なモデルなどです。

次に、通常、機能の次元を減らしたいと考えています。これは、PCA、ICA、LDAなどのアルゴリズムが入る場所であり、データポイントをより低い次元空間に投影して、ほとんどの分散(PCA)を維持したり、異なるカテゴリ(LDA)のポイントの最適な分離を確保したりします。

次に、さまざまな人の顔を区別するために、機能に関する分類器を訓練したいと思うでしょう。ここから選択できるアルゴリズムは、最も近い隣接、サポートベクターマシン、隠されたマルコフモデル、ベイズネットなどなど、選択できます。

特定の段階のアルゴリズムの選択は、他の段階のアルゴリズムに依存している場合と依存しない場合があることに注意してください。たとえば、PCAを使用して、ほぼすべてのタイプの機能の次元を減らすことができます。一方、変形可能なメッシュで表される面にサポートベクターマシン分類器を使用する方法はすぐにはわかりません。

最初にやろうとするべきことは、問題を非常に正確に定義することだと思います。写真であなたの家族を認識するなど、ほんの数人の人の顔を区別したいですか?巨大なデータベースの人々を認識したいですか?顔ごとにトレーニング画像がたくさんありますか、それともほんの数個しかありませんか?さまざまな方向と照明条件を処理しますか?

これらの質問に対する答えは、あなたの問題がどれほど複雑であるかを決定し、確かにあなたの選択に影響を与えます。

編集:これがaです 定説 同様の問題を解決しようとした人の。それは2002年からですが、私見は始めるのに良い場所です。

他のヒント

深度マップを検討したい。それが最先端です。まばらな球面表現について読んでみてください。固有顔はそれほど堅牢ではありません。いくつかの要因に不変ではありません。最先端の顔認識は、深さ情報を持つ3D PCLを使用しています。これにより、暗闇の中でも認識できます。 ASUSカメラまたはKinectカメラを使用して、深さ情報を収集できます。それが役立つことを願っています!

マリレーナ港で走るハールカスケード。

Haar Cascadeは、ファイルを読み取り、コンピューターに何かがどのように見えるかを伝えるアルゴリズムです。私は過去にそれを使用して、顔、メガネ、ただの笑顔、手、コークス缶を検出しました。

http://en.wikipedia.org/wiki/haar-like_features

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top