حساب حقول البروفيسور ل GST/GLD غير متماسكة ومتماسكة؟ (CUDA/OPENCL)

StackOverflow https://stackoverflow.com/questions/3856460

سؤال

أنا أستخدم Compute Prof 3.2 و GeForce GTX 280. لدي القدرة على حساب 1.3 ثم أعتقد.

هذا الملف, ، يبدو أنه يوضح أنني يجب أن أكون قادرًا على رؤية هذه الحقول لأنني أستخدم جهاز حساب 1.x. حسنًا ، لا أراهم ودليل المستخدم لـ 3.2 أدوات يقول إنه لا يمكنني رؤيتها ، لكن يدعوهم gst_uncoalesced و gst_coalesced.

خلاصة القول ، أنا في حيرة من أمري بشأن كيفية معرفة من البروفيلر إذا كنت أقوم بقراءة غير محازية من الذاكرة العالمية. لا يبدو أن بطاقات Fermi ستقول أيضًا ، لكنني لست قلقًا بشأنها الآن. إذا كان بإمكان أي شخص توضيح الموقف ، فسأقدر ذلك.

أيضًا ، قيل لي أن أنظر إلى تجميع نواة بلدي لمعرفة هذه الأشياء ، لذلك يتم تقدير أي تفصيل حول كيفية القيام بذلك أيضًا. لقد بدأت للتو في محاولة معرفة هذه الأشياء أيضًا :)

هل كانت مفيدة؟

المحلول

واجهت مشاكل مماثلة مع الإخراج التنميط. أثناء وجوده في 8600 (COMPUTE CAMBITION 1.0) ، أظهر كل من القراءات/المكتبات غير المتجانسة وغير المصممة ، فقد أظهرت فقط على GTX280. لقد افترضت أن ذلك كان بسبب أفضل الفحم على GTX 280 مما يجعل القطع أقل وضوحًا (هل قراءة ذاكرة لا يلزم كل كلمة واحدة غير مطلوبة؟). ومع ذلك يمكنك فقط النظر في الجدول الموجز. هناك تجد حمولة وفعالية المتجر لكل نواة. إذا تم تجميع جميع الوصول إلى أن الكفاءة يجب أن تكون 1 ، وإلا فإنها أقل ثم واحدة (0.5 وهذا يعني أنه يتم استخدام نصف البايتات المحملة فقط).

بالطبع نظرًا لأن هذا لا يساعدك في معرفة الكثير من أين توجد وصولك غير المصحوب داخل kernel ، فإن أفضل طريقة لا تزال تعرف كيف تعمل العناوين (يتم تجميع عناوين كل نصف الحرب إلى 32 و 64 و 128BYTE ، ولا يمكن الوصول إليها. داخل تلك المنطقة يتم نقلها على أي حال) ولا يزال تحليل AccessPatterns هو الطريق للذهاب في النهاية.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top