DCTのIntelベースのハードウェアスピードアップ?
-
30-10-2019 - |
質問
Intelハードウェアをターゲットにした画像処理アルゴリズムを作成しています。一般に、一般的なC実装を好みますが、そのコアで非常にうまく機能する多くの個別のコサイン変換(DCT)を行うアルゴリズムを特定しました。残念ながら、当社のスループット要件は、一般的なC実装が約2桁遅すぎるようなものです。他のいくつかのトリックを通して1桁を得ることができるので、DCTを約1桁改善できれば、成功への道があります。
Intel MMXは、これらのDCTを実行するためにハードウェアアクセラレーションを得る方法ですか?これらの悪い男の子をスピードアップするために活用できる他のIntel固有のライブラリやハードウェアはありますか?
どこを見始めますか?これは私にとって新しい仕事であり、初めてIntelハードウェアを一生懸命掘り下げるので、どんなポインターも最も高く評価されます。
正しい解決策はありません
所属していません StackOverflow