Dimensione della memoria condivisa allocata staticamente per blocco con Calcola Prof (Cuda / OpenCL)
Domanda
elaborazione di Nvidia In prof c'è una colonna chiamata "mem private static per gruppo di lavoro" e il tooltip di si dice "Dimensione della memoria condivisa allocata staticamente per blocco". I miei spettacoli di applicazione che sto ottenendo 64 (byte presumo) per blocco. Vuol dire che sto usando da qualche parte tra 1-64 di quei byte o è il profiler solo dirmi che questa quantità di memoria condivisa è stato allocato e chissà se è stato utilizzato a tutti?
Soluzione
Se è allocata, è probabilmente perché è stato utilizzato. Per quanto ne so CUDA passa parametri al kernel tramite memoria condivisa, quindi è necessario essere quello.
Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow