質問

リアルタイム3Dモデリングでアプリケーションを最適化しようとしています。アプリケーションの計算部分はほとんど完全にCUDAのGPUに実行されます。このアプリケーションは、1秒間に小さい(6×6)倍精度対称正定値線維系AX= B 500+の解を必要とする。現在、これはCholskyを使用して効率的なCPUベースの線形代数ライブラリーを使用して行われていますが、CPU-GPUからのデータのコピーは、毎秒数百回の数百回、カーネルのオーバーヘッドなどが必要です。

GPU上の線形システムへのソリューションをすべてまったくCPUに入らずに単独で計算できますか?私はマグマ図書館について少し読んだが、GPUのみのアルゴリズムではなくハイブリッドアルゴリズムを使用しているようです。

GPU上の個々の線形システムの解決策が既存のCPUベースのライブラリよりも遅くなる予定であるという事実を策定していますが、それを削除することによって構成することができるかどうかを確認したいと思います。ホストとデバイスとの間のデータ通信とカーネルのオーバーヘッドは、毎秒何億時間かかります。 GPUのような代替案がない場合は、この特定の6x6ケースをGPUのみで解決するために何かを実装することについてどう思いますか? GPU BLASライブラリーによる巨大な時間投資なしに行うことができますか?

役に立ちましたか?

解決

NVIDIA登録されたAX= Bソルバーの昨年の秋に登録された開発者Webサイトへのコードコード。このコードは一般的な行列のために機能し、対称行列を完全な行列に拡大することができます(それは6x6の問題にならないでください)。コードが正の明確な行列に不要なピボットを実行するにつれて、それはあなたのケースにとって最適ではありませんが、コードはBSDライセンスの下にあるので目的のためにそれを変更することができるかもしれません。

NVIDIAの標準開発者Webサイトは現時点でいくつかの問題を経験しています。この時点でバッチ付きソルバーコードをダウンロードする方法は次のとおりです。

(1) http://www.nvidia.com/content /cuda/cuda-toolkit.html

(2)既存のNVDEPOLOPERアカウント(PARTNERS.NVIDIA.COMをviand.nvveveloperにログインする)をクリックすると、画面の右半分のリンクをクリックします。それ以外の場合は、新しいアカウントを適用するには、[NVDeveloperを結合]をクリックします。新しいアカウントの要求は通常1営業日以内に承認されています。

(3)メールアドレスとパスワードを入力してプロンプトでログインします。

(4)「最新のダウンロード」という右側には右側に区間があります。上からの5番目の項目は「バッチソルバー」です。それをクリックしてコードのダウンロードページを表示します。

(5)「ダウンロード」リンクをクリックしてから、「承認」をクリックしてライセンス条項を受け入れます。あなたのダウンロードは始めるべきです。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top