Question

Je constate que je peux utiliser des blocs de mémoire pour les matrices soit alloué en utilisant la fonction cudamalloc () ou cublasalloc () pour appeler des fonctions de cublas. Les taux de transfert de matrice et de calcul sont plus lentes pour les tableaux alloués en utilisant cudamalloc () plutôt que cublasalloc (), bien qu'il existe d'autres avantages à l'aide de tableaux en utilisant cudamalloc (). Pourquoi est-ce le cas? Ce serait génial d'entendre certains commentaires.

Était-ce utile?

La solution

cublasAlloc est essentiellement une enveloppe autour cudaMalloc() donc il devrait y avoir aucune différence, il n'y a rien d'autre qui change dans votre code?

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top