CUDA مقابل إدارة ذاكرة CUBLAS

https://stackoverflow.com/questions/1677784

16-09-2019
|

سؤال

لقد لاحظت أنه يمكنني استخدام كتل الذاكرة للمصفوفات المخصصة باستخدام وظيفة cudamalloc () أو cublasalloc () لاستدعاء وظائف cublas. تكون معدلات نقل المصفوفة والحاسوبية أبطأ للمصفوفات المخصصة باستخدام Cudamalloc () بدلا من cublasalloc ()، على الرغم من وجود مزايا أخرى لاستخدام المصفوفات باستخدام Cudamalloc (). لماذا هو أن هذه القضية؟ سيكون من الرائع سماع بعض التعليقات.

المحلول

cublasAlloc هو في الأساس التفاف حولها cudaMalloc() لذلك يجب ألا يكون هناك فرق، هل هناك أي شيء آخر يتغير في التعليمات البرمجية الخاصة بك؟

مرخصة بموجب: CC-BY-SA مع الإسناد

لا تنتمي إلى StackOverflow