Вычислить поля проф для некогерентного и согласованного GST / GLD? (CUDA / OPENCL)

StackOverflow https://stackoverflow.com/questions/3856460

Вопрос

Я использую Compute Prof 3.2 и GeForce GTX 280. У меня вычисляют возможности 1.3, тогда я полагаю.

Этот файл, кажется, показывает, что я смогу увидеть эти поля, так как я использую устройство 1.x Compute. Ну, я их не вижу, и руководство пользователя для 3.2 Toolkit говорит, что я не вижу их, но вызывает их gst_uncoalesced и gst_coalesced.

Подводя итог, я запутался о том, как я должен выяснить из профилировщика, если я делаю нелогичные читания от Global Memory. Не похоже, что карты Ферми тоже скажут, но я не беспокоюсь о них сейчас. Если кто-то может уточнить ситуацию, я был бы признателен.

Кроме того, мне сказали посмотреть на сборку моих ядер, чтобы понять этот материал, поэтому любая разработка о том, как это сделать это тоже ценится. Я просто начинаю пытаться и понять, что это тоже все :)

Это было полезно?

Решение

У меня были похожие проблемы с продукцией профилирования. В то время как на 8600 (Compute Computability 1.0) он показал как объединенные, так и необработанные чтения / пишеты, он показал только в GTX280. Я предположил, что было из-за лучшего коаблирования на GTX 280, сделав сокращение менее четко (это память, для которой все, кроме одного слова не нужна безгодом?). Однако вы можете просто посмотреть в сводную таблицу. Там вы найдете нагрузку и магазин Efficieny для каждого ядра. Если все доступы объединяются, что эффективность должна быть 1, в противном случае его меньше, чем один (0,5 означает, что используются только половина загруженных байтов).

Конечно, поскольку это не помогает вам многого выяснить, где именно ваши бессвязные доступны внутри вашего ядра, наилучшим способом все еще знает, как коалисписные работы (адреса каждого полуварпа собраны на доступе 32, 64 и 128BYTE, а не доступны ценности Внутри этой области переносится в любом случае) и анализ ваших AccessPatterns по-прежнему способом идти в конце.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top