パフォーマンスとグローバル効率を測定するために、GPUでSQRTに割り当てられたフロップ

StackOverflow https://stackoverflow.com/questions/5933112

質問

GPUの実装では、グロップの観点からパフォーマンスを推定する必要があります。コードは非常に基本的なものですが、私の問題は、1つ以上であろうと、操作「SQRT」または「MAD」にいくつのフロップを与えるべきかです。

その上、これらの操作に1フロップを1フロップしている場合、コードの50 GFLOPSを取得しますが、このGPUの理論的最大値は500GFLOPSです。 Precentagesでそれを表現すれば、10%を取得します。スピードアップに関しては、100回獲得します。だから私はそれが素晴らしいと思いますが、10%が少し低い収量のようです、あなたはどう思いますか?

ありがとう

正しい解決策はありません

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top