Frage

Ich bin mit Compute Prof 3.2 und eine Geforce GTX 280. Ich habe Rechenkapazität 1.3 dann glaube ich.

Diese Datei zu zeigen, scheint, dass ich diese Felder zu sehen, die Lage sein sollte, da ich eine 1.x Rechengerät verwenden. Nun, ich sehe sie nicht und das Benutzerhandbuch für 3.2-Toolkit sagt, dass ich sie nicht sehen können, aber sie nennt gst_uncoalesced und gst_coalesced.

Um es zusammenzufassen, ich bin verwirrt darüber, wie ich aus dem Profiler herauszufinden, sollte, wenn ich mache nicht-koalesziert liest aus dem globalen Speicher. Es sieht nicht wie Fermi-Karten sagen auch nicht, aber ich bin nicht über sie jetzt besorgt. Wenn jemand auf der Situation erarbeiten kann ich würde es zu schätzen wissen.

Auch ich habe bei der Montage meines Kernel Blick sagt, dieses Zeug, um herauszufinden, so dass jede Ausarbeitung, wie dies zu tun zu schätzen. Ich beginne gerade, um zu versuchen und Figur, die Sachen aus zu:)

War es hilfreich?

Lösung

Ich hatte ähnliche Probleme mit der Profilierung ausgegeben. Während auf einer 8600 (Rechenkapazität 1.0) es sowohl verschmolzenen und uncoalesced zeigte liest / schreibt, zeigte, dass es nur auf GTX280 verschmolzen. Ich nahm an, war aufgrund der besser auf die gtx koaleszierende 280 macht der Schnitt weniger klar (ein Speicher für die lesen ist alles andere als ein Wort nicht uncoalesced benötigt wird?). Sie können jedoch nur die Übersichtstabelle suchen. Dort finden Sie für jeden Kern eine Last und einen Speicher efficieny finden. Wenn alle Zugriffe werden koalesziert, dass die Effizienz 1 sein sollte, da sonst ihre weniger als eine (0,5 Bedeutung, die nur die Hälfte des geladenen Bytes verwendet werden).

Natürlich, da dies nicht, dass Sie viel hilft, herauszufinden, wo genau Ihre uncoalesced Zugriffe sind in Ihrem Kernel, der beste Weg, nach wie vor ist, zu wissen, wie die koaleszierende Werke (Adressen jeden halfwarp werden in 32 gesammelt, 64 und 128 Byte-Zugriffe, nicht zugegriffen Werte in diesem Bereich übertragen sowieso) und Ihre accesspatterns Analyse ist immer noch die Möglichkeit, am Ende zu gehen.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top