パフォーマンスとグローバル効率を測定するために、GPUでSQRTに割り当てられたフロップ
-
30-10-2019 - |
質問
GPUの実装では、グロップの観点からパフォーマンスを推定する必要があります。コードは非常に基本的なものですが、私の問題は、1つ以上であろうと、操作「SQRT」または「MAD」にいくつのフロップを与えるべきかです。
その上、これらの操作に1フロップを1フロップしている場合、コードの50 GFLOPSを取得しますが、このGPUの理論的最大値は500GFLOPSです。 Precentagesでそれを表現すれば、10%を取得します。スピードアップに関しては、100回獲得します。だから私はそれが素晴らしいと思いますが、10%が少し低い収量のようです、あなたはどう思いますか?
ありがとう
正しい解決策はありません
所属していません StackOverflow