是否有可能使GHC为各个SSE世代生产SIMD代码?

例如。有这样的程序

import Data.Array.Vector
main = print . sumU $ (enumFromToFracU 1 10000000 :: UArr Double)

我可以看到生成的代码(为64位x86编译)使用标量模式(C和ASM后端)使用SSE指令。因此,添加SSD而不是ADDPD。对于程序的类型,我在使用矢量说明方面工作对于性能很重要。像我这样的新手有什么简单的方法可以使GHC使用SSE模拟代码?

有帮助吗?

解决方案

是的,可以通过C后端来进行试验和错误。我使用的标志:

 gcc -O2 -funbox-strict-fields -fvia-C -optc-O3 -march=native -optc-msse4

然后,Hope GCC将紧密的循环GHC通过UVECTOR代码生成,并意识到SIMD潜力。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top