Pregunta

Me he dado cuenta de que puedo usar bloques de memoria para matrices función asignada, ya sea usando cudamalloc () o cublasalloc () para llamar a funciones CUBLAS. Las tasas de transferencia de la matriz y de cálculo son más lentos para las matrices asignados usando cudamalloc () en lugar de cublasalloc (), aunque hay otras ventajas de utilizar matrices usando cudamalloc (). ¿Por qué es ese el caso? Sería muy bueno escuchar algunos comentarios.

¿Fue útil?

Solución

cublasAlloc es esencialmente una envoltura alrededor de cudaMalloc() por lo que no debería haber ninguna diferencia, ¿hay algo más que los cambios en su código?

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top