我试图通过使用Inline组件使用MMX和SSE指令集来优化一些算术。但是,我无法找到这些增强说明集的时间和用法的良好参考。您能帮我找到包含有关说明的吞吐量,延迟,操作数以及简短描述的信息吗?

到目前为止,我发现:

英特尔指导参考英特尔64和IA-32体系结构开发人员手册:卷。 2a英特尔64和IA-32体系结构开发人员手册:卷。 2b

英特尔优化指南http://www.intel.com/assets/pdf/manual/248966.pdf

整数操作的时间http://gmplib.org/~tege/x86-timing.pdf

有帮助吗?

解决方案

我本来会想到,英特尔指令参考应该为这些指令提供足够的指南吗?它具有每个伪代码,对其操作的描述,在某些情况下甚至是代表性案例的少量图。

对于时间安排,我没有知道的官方指南。 Agner Fog的页面是标准参考:

http://www.agner.org/optimize/

其他提示

英特尔的内在指南 (在AVX页面的左下方),是一个井井有条的可搜索工具,您可以使用SSE版本和/或指令类型(例如,FP算术或整数逻辑)缩小范围。

对于每个指令,它还通过CPU和参数显示了延迟/吞吐量表。

时间安排在“英特尔优化指南”中;有关每个CPU体系结构的每项指令的吞吐量和延迟,请参见附录C。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top