CUDA противУправление памятью CuBlas
Вопрос
Я заметил, что я могу использовать блоки памяти для матриц, либо выделенные с помощью функции cudamalloc(), либо cublasalloc() для вызова функций cublas.Скорости передачи матрицы и вычисления медленнее для массивов, выделенных с использованием cudamalloc(), а не cublasalloc(), хотя есть и другие преимущества использования массивов с использованием cudamalloc().Почему это так происходит?Было бы здорово услышать несколько комментариев.
Решение
cublasAlloc
по сути, это обертка вокруг cudaMalloc()
таким образом, не должно быть никакой разницы, есть ли что-нибудь еще, что меняется в вашем коде?
Не связан с StackOverflow