Вопрос

Я заметил, что я могу использовать блоки памяти для матриц, либо выделенные с помощью функции cudamalloc(), либо cublasalloc() для вызова функций cublas.Скорости передачи матрицы и вычисления медленнее для массивов, выделенных с использованием cudamalloc(), а не cublasalloc(), хотя есть и другие преимущества использования массивов с использованием cudamalloc().Почему это так происходит?Было бы здорово услышать несколько комментариев.

Это было полезно?

Решение

cublasAlloc по сути, это обертка вокруг cudaMalloc() таким образом, не должно быть никакой разницы, есть ли что-нибудь еще, что меняется в вашем коде?

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top