CUDA contro la gestione della memoria CuBlas

https://stackoverflow.com/questions/1677784

memory
cuda
cublas

16-09-2019
|

Domanda

Ho notato che posso usare blocchi di memoria per le matrici funzione sia assegnata utilizzando cudamalloc () o cublasalloc () per richiamare le funzioni cublas. Le velocità di trasferimento matrice e computazionale sono più lenti per array assegnati utilizzando cudamalloc () anziché cublasalloc (), anche se ci sono altri vantaggi di utilizzare array utilizzando cudamalloc (). Perché è che il caso? Sarebbe bello sentire alcuni commenti.

Soluzione

cublasAlloc è essenzialmente un wrapper cudaMalloc() quindi non ci dovrebbe essere alcuna differenza, c'è qualcos'altro che cambia nel codice?

Autorizzato sotto: CC-BY-SA insieme a attribuzione

Non affiliato a StackOverflow