質問

Intelハードウェアをターゲットにした画像処理アルゴリズムを作成しています。一般に、一般的なC実装を好みますが、そのコアで非常にうまく機能する多くの個別のコサイン変換(DCT)を行うアルゴリズムを特定しました。残念ながら、当社のスループット要件は、一般的なC実装が約2桁遅すぎるようなものです。他のいくつかのトリックを通して1桁を得ることができるので、DCTを約1桁改善できれば、成功への道があります。

Intel MMXは、これらのDCTを実行するためにハードウェアアクセラレーションを得る方法ですか?これらの悪い男の子をスピードアップするために活用できる他のIntel固有のライブラリやハードウェアはありますか?

どこを見始めますか?これは私にとって新しい仕事であり、初めてIntelハードウェアを一生懸命掘り下げるので、どんなポインターも最も高く評価されます。

正しい解決策はありません

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top