سؤال

لقد لاحظت أنه يمكنني استخدام كتل الذاكرة للمصفوفات المخصصة باستخدام وظيفة cudamalloc () أو cublasalloc () لاستدعاء وظائف cublas. تكون معدلات نقل المصفوفة والحاسوبية أبطأ للمصفوفات المخصصة باستخدام Cudamalloc () بدلا من cublasalloc ()، على الرغم من وجود مزايا أخرى لاستخدام المصفوفات باستخدام Cudamalloc (). لماذا هو أن هذه القضية؟ سيكون من الرائع سماع بعض التعليقات.

هل كانت مفيدة؟

المحلول

cublasAlloc هو في الأساس التفاف حولها cudaMalloc() لذلك يجب ألا يكون هناك فرق، هل هناك أي شيء آخر يتغير في التعليمات البرمجية الخاصة بك؟

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top