レイテンシとスループットを備えた簡潔なSSEおよびMMX命令参照
質問
インラインアセンブリを備えたMMXおよびSSE命令セットを使用して、算術を最適化しようとしています。ただし、これらの強化された命令セットのタイミングと使用に関する適切な参照を見つけることができませんでした。スループット、レイテンシ、オペランド、そしておそらく指示の短い説明に関する情報を含む参照を見つけるのを手伝ってください。
これまでのところ、私は発見しました:
Intel命令参照Intel 64およびIA-32アーキテクチャ開発者マニュアル:Vol。 2a とIntel 64およびIA-32アーキテクチャ開発者マニュアル:Vol。 2b
Intel Optimization Guidehttp://www.intel.com/assets/pdf/manual/248966.pdf
整数操作のタイミングhttp://gmplib.org/~tege/x86-timing.pdf
解決
Intel命令の参照は、これらの指示が実際に何をするかについての適切なガイドを提供する必要があります。それぞれに擬似コード、その操作の説明、場合によっては代表的なケースの小さな図さえあります。
タイミングについては、私が知っている公式ガイドはありません。 Agner Fogのページは標準リファレンスです。
他のヒント
Intelの本質的なガイド (AVXページの左下に)、よく組織化された検索可能なツールで、SSEバージョンおよび/または命令タイプなど、FP算術または整数論理で絞り込むことができます。
各命令について、CPUおよびパラメーターによるレイテンシ/スループットテーブルも表示されます。
タイミングは「Intel Optimization Guide」にあります。 CPUアーキテクチャごとの各命令については、スループットとレイテンシーについては付録Cを参照してください。