Größe des statisch zugewiesenen Shared-Memory pro Block mit Compute Prof (Cuda / OpenCL)

StackOverflow https://stackoverflow.com/questions/3927800

  •  30-09-2019
  •  | 
  •  

Frage

In Nvidias Compute-prof gibt es eine Spalte „statische Private mem pro Arbeitsgruppe“ genannt, und der Tooltip der es heißt „Größe der statisch zugewiesenen Shared-Memory pro Block“. Meine Anwendung zeigt, dass ich 64 bin immer (Bytes Ich gehe davon aus) pro Block. Heißt das, ich meine bin mit irgendwo zwischen 1-64 dieser Bytes oder ist der Profiler sagt mir nur, dass diese Menge an gemeinsam genutzten Speicher zugewiesen wurde und wer weiß, ob sie überhaupt verwendet wurde?

War es hilfreich?

Lösung

Wenn es zugeordnet ist, ist es wahrscheinlich, weil Sie es verwendet. AFAIK CUDA gibt Parameter an Kernel über Shared Memory, so ist es, dass sein muss.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top