CUDA مقابل إدارة ذاكرة CUBLAS
سؤال
لقد لاحظت أنه يمكنني استخدام كتل الذاكرة للمصفوفات المخصصة باستخدام وظيفة cudamalloc () أو cublasalloc () لاستدعاء وظائف cublas. تكون معدلات نقل المصفوفة والحاسوبية أبطأ للمصفوفات المخصصة باستخدام Cudamalloc () بدلا من cublasalloc ()، على الرغم من وجود مزايا أخرى لاستخدام المصفوفات باستخدام Cudamalloc (). لماذا هو أن هذه القضية؟ سيكون من الرائع سماع بعض التعليقات.
المحلول
cublasAlloc
هو في الأساس التفاف حولها cudaMalloc()
لذلك يجب ألا يكون هناك فرق، هل هناك أي شيء آخر يتغير في التعليمات البرمجية الخاصة بك؟
لا تنتمي إلى StackOverflow