質問

写真の一部を取得し、同じオブジェクトの別の写真に一致させることができるアルゴリズムを作成したい。

たとえば、コンピューターに花瓶の写真と花瓶の入ったシーンの写真を与えた場合、花瓶が画像のどこにあるかを判断できると思います。 このようなアルゴリズムの開発を開始するにはどうすればよいですか?

このアルゴリズムの最終的な使用法は、たとえば、誰かの顔の写真を使って、彼らが群衆の中にいるかどうかを判断できるアプリケーションです。このアルゴリズムは、最終的にビデオストリームに適用されます。

編集:すぐに解決するつもりはないので、この問題の実際の解決策は期待していません。本当の質問は、それを行うアルゴリズムを作成できるように、このようなものをコンピューターにどのように定義するかでした。

ありがとう

役に立ちましたか?

解決

最初に説明する問題と2番目の問題は両方ともまったく異なります。

それぞれの大部分は多数によって解決されますマシンビジョンライブラリが利用可能。どちらのタスクでも成功するためには、テクニックの組み合わせが必要になる場合があります。

最初のものでは、オブジェクトを一般的に認識するものが必要になります。おそらく、複数のアルゴリズムを協調して使用してモデル画像の前景オブジェクトを特定し、パーティション分割されたターゲット画像のある種の加重比較を行うでしょう。

2番目の場合、顔を調べることは、上記の一般的な認識機能に比べてはるかに難しい問題です。顔はすべて同じように見えます。一般的なレコグナイザーが気付くであろうことは、顔を区別するのに向いていない可能性があります。顔認識に既に調整されたアルゴリズムが必要です。幸いなことに、これは急速に成熟しているフィールドであり、おそらく最初のケースと同様にこれを行うことができますが、異なる関数セットを使用します。

他のヒント

私の以前の教師は、彼の入力が何かの詳細な3Dモデルであったことを除き、同様の問題に関する博士論文を書きました。これは非常に重要な問題であり、単一の「答え」はなく、スタックオーバーフロー形式に適合するものは確かにありません。

私の最高の答え:たくさんのお金を集めて、経験豊富なプログラマを雇ってください。

幸運を祈ります。

単純な答えは、顔を記述する数学的な方法を見つけることです。これは、角度と部分的な欠落データを考慮して、それを洗練して教えます。

明らかにアップルはこのようなことをしましたが、それでも間違いを犯し、前進するにつれて教えられる必要があります。

プログラミングよりも数学に関することになると思います。

これはかなりの難題になると思います。これは非常に難しい問題であり、人工知能(AI)の領域に属する多くのコンピューティング分野の1つです。顔認識は確かにこの問題の最も一般的な変種であり、メディアで読むことができるにもかかわらず、主張された成功はそれが意図されたものではありません。最も近いソリューションにはニューラルネットが関係しており、通常は非常に明確で慎重に選択された画像が必要だと思います。

ただし、こちらをお読みください。がんばって!

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top