CUDA par rapport à la gestion de la mémoire CuBlas
Question
Je constate que je peux utiliser des blocs de mémoire pour les matrices soit alloué en utilisant la fonction cudamalloc () ou cublasalloc () pour appeler des fonctions de cublas. Les taux de transfert de matrice et de calcul sont plus lentes pour les tableaux alloués en utilisant cudamalloc () plutôt que cublasalloc (), bien qu'il existe d'autres avantages à l'aide de tableaux en utilisant cudamalloc (). Pourquoi est-ce le cas? Ce serait génial d'entendre certains commentaires.
La solution
cublasAlloc
est essentiellement une enveloppe autour cudaMalloc()
donc il devrait y avoir aucune différence, il n'y a rien d'autre qui change dans votre code?
Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow