Domanda

Ho notato che posso usare blocchi di memoria per le matrici funzione sia assegnata utilizzando cudamalloc () o cublasalloc () per richiamare le funzioni cublas. Le velocità di trasferimento matrice e computazionale sono più lenti per array assegnati utilizzando cudamalloc () anziché cublasalloc (), anche se ci sono altri vantaggi di utilizzare array utilizzando cudamalloc (). Perché è che il caso? Sarebbe bello sentire alcuni commenti.

È stato utile?

Soluzione

cublasAlloc è essenzialmente un wrapper cudaMalloc() quindi non ci dovrebbe essere alcuna differenza, c'è qualcos'altro che cambia nel codice?

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top