パフォーマンスを向上させるために cuda プログラムを最適化するにはどうすればよいですか?
質問
キーを生成するための matlab プログラム(cuda)を作成します。
パフォーマンスを向上させるために cuda プログラムを最適化するにはどうすればよいですか?
解決
あなたはCUDAのプログラミングツールとアーキテクチャを学ぶいくつかの時間を費やす必要があります。そこに良い情報の多くは、 developer.nvidia.com のであり、彼らはCUDA開発者のためにそこに積極的で親切フォーラムを持っています - 初心者のための絶好の場所は、CUDA開発に速度まで取得する
他のヒント
には大量のトレーニング資料があります NVIDIA の Web サイト, 、具体的には、 トレーニングページ 少なくとも 1 つの無料サービスにサインアップしてください オンラインセミナー (事前に録画されたセッションも利用可能です。同じリンク)。
開始したら、次のいずれかの場所にコードを投稿してください。 NVIDIA CUDA フォーラム または、ここ StackOverflow やコミュニティが役立つ可能性がありますが、より具体的な回答を得るには、より具体的な質問が必要です。
- まず、並列アルゴリズムを使用します。
- メモリアクセスパターンを調整する(読み取りの結合など)
- テクスチャ、共有メモリを使用する
- コア占有率を調整する (cuda Excel スプレッドシートを確認する)
- ストリームを使用する
プログラミング ガイドとベスト プラクティスを読む必要があります。Programming Gems も非常に優れています。
所属していません StackOverflow