compreender os atrasos de comunicação no paralelismo [fechado]
Pergunta
Estou lendo " arquitetura de computadores:A Quantative Approach, 5th ed " e estou olhando para um exemplo do Capítulo 5 na página 350.Em anexo está uma análise do exemplo em questão.Não sigo bem a lógica de como eles fazem as coisas neste exemplo.
As minhas perguntas são as seguintes:
- De onde vem o tempo de ciclo de 0,3 ns?
- 200/0. 3 é aproximadamente 666 ciclos, eu sigo isso.No entanto, quando conectado de volta à equação CPI, não faz sentido:0,2% (0,002) x 666 é igual a 1,332 e não a 1,2.O que se passa aqui?
- Quando eles dizem que "o multiprocessador com todas as referências locais é 1,7 / 0,5 = 3,4 vezes mais rápido", de onde eles estão obtendo isso?Significado:Não vejo, em parte alguma, nas informações fornecidas, que a comunicação local seja duas vezes mais rápida...
Qualquer ajuda seria apreciada.
Solução
De onde vem o tempo de ciclo de 0,3 ns?
Isso vem da taxa de clock de 3,3 GHz.1 / 3,3 GHz = 0,3 ns.
200/0. 3 é aproximadamente 666 ciclos, eu sigo isso.No entanto, quando conectado de volta à equação CPI, não faz sentido:0,2% (0,002) x 666 é igual a 1,332 e não a 1,2.O que se passa aqui?
Acho que tens razão.Parece um erro de impressão.Isso deve ser
IPC = 0,5 + 1,33 = 1,83
Quando eles dizem que "o multiprocessador com todas as referências locais é 1,7 / 0,5 = 3,4 vezes mais rápido", de onde eles estão obtendo isso?Significado:Não vejo, em parte alguma, nas informações fornecidas, que a comunicação local seja duas vezes mais rápida...
Eles não dizem em nenhum lugar que a comunicação local é duas vezes mais rápida.Eles estão dividindo o IPC efetivo que calcularam para o multiprocessador com 0,2% de referências remotas pelo IPC base de 0,5.Isso informa quantas vezes mais rápido é o multiprocessador com todas as referências locais.(Claro que deve ser cerca de 1,83/0,5 = 3,66 vezes mais rápido.)