Pergunta

Estou usando o Compute Prof 3.2 e um GeForce GTX 280. Eu tenho capacidade de computação 1.3 Então acredito.

Este ficheiro, parece mostrar que eu deveria poder ver esses campos, pois estou usando um dispositivo de computação 1.x. Bem, eu não os vejo e o guia do usuário para 3.2 Toolkit diz que não posso vê -los, mas os chama gst_uncoalesced e gst_coalesced.

Para resumir, estou confuso sobre como devo descobrir do Profiler se estiver fazendo leituras não co-co-co-co-co-co-co-co-co-co-co-co-co-co-coalescentes da Memória Global. Também não parece que os cartões Fermi dirão, mas não estou preocupado com eles por enquanto. Se alguém puder elaborar a situação, eu apreciaria.

Além disso, me disseram para olhar para a assembléia dos meus grãos para descobrir essas coisas, portanto, qualquer elaboração sobre como fazer isso também é apreciada. Estou apenas começando a tentar descobrir essas coisas também :)

Foi útil?

Solução

Eu tive problemas semelhantes com a saída de perfil. Enquanto em um 8600 (capacidade de computação 1.0), ele mostrou leituras/gravações coalescidas e desconhecidas, mostrou apenas coalesco no GTX280. Presumi que isso se devesse ao melhor coalesco no GTX 280, tornando o corte menos claro (é uma leitura de memória para a qual todas, exceto uma palavra, não são necessárias desconhecidas?). No entanto, você pode apenas olhar para a tabela de resumo. Lá você encontra uma carga e uma eficácia da loja para cada kernel. Se todos os acessos forem coalescedentes, a eficiência deve ser 1, caso contrário, é menor que um (0,5 significa que apenas metade dos bytes carregados são usados).

É claro que, como isso não ajuda você a descobrir muito onde exatamente seus acessos desconectados estão dentro do seu kernel, a melhor maneira ainda é saber como o coalescante funciona (os endereços de cada meia -warp são coletados em 32, 64 e 128 Byte Accesses, não valores acessados Dentro dessa área são transferidos de qualquer maneira) e analisar seus padrões de acesso ainda é o caminho a seguir no final.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top