Pergunta

Tenho notado que eu posso usar blocos de memória para matrizes quer alocados usando cudaMalloc () ou cublasalloc () função para funções cublas chamada. As taxas de transferência de matriz e computacional são mais lentos para matrizes atribuída usando cudaMalloc () em vez de cublasalloc (), embora haja outras vantagens de se utilizar matrizes utilizando cudaMalloc (). Por que é esse o caso? Seria ótimo ouvir alguns comentários.

Foi útil?

Solução

cublasAlloc é essencialmente um invólucro em torno cudaMalloc() então não deve haver nenhuma diferença, é outra coisa lá qualquer coisa que mudanças em seu código?

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top