简洁的SSE和MMX指令参考,带有潜伏期和吞吐量
题
我试图通过使用Inline组件使用MMX和SSE指令集来优化一些算术。但是,我无法找到这些增强说明集的时间和用法的良好参考。您能帮我找到包含有关说明的吞吐量,延迟,操作数以及简短描述的信息吗?
到目前为止,我发现:
英特尔指导参考英特尔64和IA-32体系结构开发人员手册:卷。 2a 和英特尔64和IA-32体系结构开发人员手册:卷。 2b
解决方案
我本来会想到,英特尔指令参考应该为这些指令提供足够的指南吗?它具有每个伪代码,对其操作的描述,在某些情况下甚至是代表性案例的少量图。
对于时间安排,我没有知道的官方指南。 Agner Fog的页面是标准参考:
其他提示
这 英特尔的内在指南 (在AVX页面的左下方),是一个井井有条的可搜索工具,您可以使用SSE版本和/或指令类型(例如,FP算术或整数逻辑)缩小范围。
对于每个指令,它还通过CPU和参数显示了延迟/吞吐量表。
时间安排在“英特尔优化指南”中;有关每个CPU体系结构的每项指令的吞吐量和延迟,请参见附录C。
不隶属于 StackOverflow