已经完成了我的应用程序,该应用程序乘以CRS矩阵和矢量(SPMV),现在唯一要做的就是计算我的应用程序所做的失败。在我看来,如果稀疏矩阵 - 矢量乘法,很难估计浮点操作的数量,因为一行中的乘数确实是“跳跃”或流利的。

我只尝试使用“ cudaprof”(可在./cuda/bin目录中使用)来测量时间 - 它可以正常工作。

任何SUMENTIONS和指示粘贴都赞赏!

有帮助吗?

解决方案

那不仅是你的意见;简单的事实是,在稀疏矩阵的情况下,操作数量与数据有关,因此您在不了解数据的情况下无法获得合理的答案。这使得不可能进行全数据估计。

这可能是您可以在很多小时内对此进行认真思考的情况之一(并进行大量研究)来进行可能准确的估算,或者您可以花几分钟写几分钟来编写现有实施的变体,以增加增量每次进行操作时的计数器。当然,这将需要一段时间才能运行(尤其是如果您不以CUDA的形式这样做),但是可能比进行思考的时间要少得多,而当答案出现时,您不必做很多工作来说服自己是正确的。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top