CUDA vs. CuBlas Speicherverwaltung
Frage
Ich habe bemerkt, dass ich Speicherblöcke für Matrizen entweder zugewiesen mit cudamalloc verwenden können () oder cublasalloc () Funktion cublas Funktionen aufzurufen. Die Matrix-Transferraten und Computational sind langsamer für Arrays cudamalloc zugeordnet () und nicht cublasalloc (), obwohl es auch andere Vorteile bei der Verwendung Arrays cudamalloc (). Warum ist das der Fall? Es wäre toll, einige Bemerkungen zu hören.
Lösung
cublasAlloc
ist im Wesentlichen ein Wrapper um cudaMalloc()
so sollte es keinen Unterschied sein, gibt es noch etwas, die in Ihrem Code ändert?
Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow