質問

私は、私はCUBLAS関数を呼び出すために行列に対してcudamallocを使用して割り当て()またはcublasalloc()関数のいずれかをメモリ・ブロックを使用することができることに気づきました。マトリックス転送速度および計算は、アレイの遅いcudamalloc()を使用してアレイを使用する他の利点があるが、むしろcublasallocよりcudamallocを()()を使用して割り当てられました。なぜそのような場合はありますか?いくつかのコメントを聞くことは素晴らしいことです。

役に立ちましたか?

解決

は差があってはならないので、cublasAllocは、本質的にcudaMalloc()のラッパーです、あなたのコードに変更する何かがあるのでしょうか?

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top