gerenciamento de memória CuBlas vs. CUDA
Pergunta
Tenho notado que eu posso usar blocos de memória para matrizes quer alocados usando cudaMalloc () ou cublasalloc () função para funções cublas chamada. As taxas de transferência de matriz e computacional são mais lentos para matrizes atribuída usando cudaMalloc () em vez de cublasalloc (), embora haja outras vantagens de se utilizar matrizes utilizando cudaMalloc (). Por que é esse o caso? Seria ótimo ouvir alguns comentários.
Solução
cublasAlloc
é essencialmente um invólucro em torno cudaMalloc()
então não deve haver nenhuma diferença, é outra coisa lá qualquer coisa que mudanças em seu código?
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow