パフォーマンスを向上させるために cuda プログラムを最適化するにはどうすればよいですか?

StackOverflow https://stackoverflow.com/questions/2326508

  •  22-09-2019
  •  | 
  •  

質問

キーを生成するための matlab プログラム(cuda)を作成します。

パフォーマンスを向上させるために cuda プログラムを最適化するにはどうすればよいですか?

役に立ちましたか?

解決

あなたはCUDAのプログラミングツールとアーキテクチャを学ぶいくつかの時間を費やす必要があります。そこに良い情報の多くは、 developer.nvidia.com のであり、彼らはCUDA開発者のためにそこに積極的で親切フォーラムを持っています - 初心者のための絶好の場所は、CUDA開発に速度まで取得する

他のヒント

には大量のトレーニング資料があります NVIDIA の Web サイト, 、具体的には、 トレーニングページ 少なくとも 1 つの無料サービスにサインアップしてください オンラインセミナー (事前に録画されたセッションも利用可能です。同じリンク)。

開始したら、次のいずれかの場所にコードを投稿してください。 NVIDIA CUDA フォーラム または、ここ StackOverflow やコミュニティが役立つ可能性がありますが、より具体的な回答を得るには、より具体的な質問が必要です。

  • まず、並列アルゴリズムを使用します。
  • メモリアクセスパターンを調整する(読み取りの結合など)
  • テクスチャ、共有メモリを使用する
  • コア占有率を調整する (cuda Excel スプレッドシートを確認する)
  • ストリームを使用する

プログラミング ガイドとベスト プラクティスを読む必要があります。Programming Gems も非常に優れています。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top