Pregunta

Estoy utilizando Calcular el profesor 3,2 y una Geforce GTX 280. Tengo la capacidad de cómputo 1.3 entonces creo.

Este archivo , parece demostrar que yo debería ser capaz de ver estos campos desde que estoy usando un dispositivo 1.x de cómputo. Bueno, yo no los veo y la Guía de Usuario 3.2 kit de herramientas dice que no puedo verlos, pero los llama gst_uncoalesced y gst_coalesced.

Para resumir, me gustaría saber cómo debo averiguar desde el perfilador si estoy haciendo no se fundieron lee de la memoria global. No se ve como Fermi tarjetas va a decir o bien, pero no estoy preocupado por ellos por ahora. Si alguien puede elaborar en la situación lo agradecería.

Además, me han dicho que vistazo a la congregación de mi núcleos a calcular esta materia hacia fuera, por lo que cualquier elaboración sobre la manera de hacer esto es apreciado también. Estoy empezando a tratar de averiguar esas cosas demasiado:)

¿Fue útil?

Solución

He tenido problemas similares con la salida de perfiles. Mientras que en un 8,600 (capacidad de cómputo 1.0) mostró tanto coalescencia y uncoalesced lecturas / escrituras, sólo mostró unieron en GTX280. Supuse que era debido a la mejor coalescencia en la GTX 280 de hacer el corte menos claro (es una memoria de lectura para los que no es necesaria todas menos una palabra uncoalesced?). Sin embargo sólo se puede mirar en la tabla de resumen. Allí se encuentra una carga y una efficieny tienda para cada núcleo. Si todos los accesos se fundieron que la eficiencia debería ser 1, de lo contrario su menos de un (0,5 significado que sólo la mitad de los bytes cargados se utilizan).

Por supuesto, ya que no ayuda mucho que averiguar dónde exactamente sus accesos uncoalesced están dentro de su núcleo, la mejor manera es aún sabiendo cómo funciona la coalescencia (direcciones de cada halfwarp se agrupan en 32, 64 y 128Byte accesos, los valores no se accede dentro de esa área se transfieren todos modos) y el análisis de sus accesspatterns sigue siendo el camino a seguir en el final.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top