Frage

Ich habe bemerkt, dass ich Speicherblöcke für Matrizen entweder zugewiesen mit cudamalloc verwenden können () oder cublasalloc () Funktion cublas Funktionen aufzurufen. Die Matrix-Transferraten und Computational sind langsamer für Arrays cudamalloc zugeordnet () und nicht cublasalloc (), obwohl es auch andere Vorteile bei der Verwendung Arrays cudamalloc (). Warum ist das der Fall? Es wäre toll, einige Bemerkungen zu hören.

War es hilfreich?

Lösung

cublasAlloc ist im Wesentlichen ein Wrapper um cudaMalloc() so sollte es keinen Unterschied sein, gibt es noch etwas, die in Ihrem Code ändert?

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top