没有任何人有编程经验为 英特尔数学核心图书馆AMD数学的核心的图书馆?我建立个人计算机的高性能的统计计算和午辩论的组成部分购买。上诉的AMD数学的核心的图书馆是,它是免费的,但是我在学术界以MKL不是昂贵的。但我会有兴趣听到的想法:

  1. 它提供了一个更好的API?
  2. 它提供了更好的业绩,平均来说,每一美元,包括许可证发放和硬件的成本。
  3. 是的 AMCL GPU 一个因素,我应该考虑?
有帮助吗?

解决方案

英特尔MKL和ACML有类似的Api但MKL具有更丰富的支持功能,包括布拉斯(和CBLAS)/特点是可扩展性。/Fft/矢量和统计的数学/疏直接和迭代的解决/疏布拉斯,等等。英特尔MKL还针对英特尔和AMD处理器并有一个活动用户论坛,你可以把要用于帮助或指导。独立评估的这两个图书馆张贴在这里:(http://www.advancedclustering.com/company-blog/high-performance-linpack-on-xeon-5500-v-opteron-2400.html)

•肖恩Corder,先进集群、(也由HPCWire:基准的挑战:尼黑勒姆和伊斯坦布尔):"在我们最近的试验以及通过现实世界的经验,我们认为,英特尔的编译器和英特尔数学核心图书馆(MKL)通常提供最佳效能。而不是只解决在英特尔的工具包,我们尝试了各种编译器,包括:英特尔,GNU编译器和波特兰基。我们还测试了各种线性代数图书馆,包括:MKL,AMD核心数学图书馆(ACML),并libGOTO从得克萨斯大学。所有的测试表明,我们可以实现的最高性能当同时使用英特尔编译器和英特尔数学的图书馆--甚至在AMD系统--这些是使用他们作为基础的我们的基准。" [基准测试表明,4核尼黑勒姆X5550 2.66GHz在74.0政府财政统计与伊斯坦布尔2435 2.6GHz在99.4政府财政统计;伊斯坦布尔只有34%的速度尽管有50%以上的核心]

希望这会有所帮助。

其他提示

事实上,有两个版本的特点是可扩展性。例行程序在ACML.那些没有后强调(_)are C版惯例,为Victor说,不需要工作区中的阵列的,你可以传递的价值观,而不是引用的参数。那些有强调过只是香草Fortran程序。做一个"dumpbin/出口"上libacml_dll.dll 你会看到的。

我已经使用AMCL其BLAS/特点是可扩展性。例行程序,所以这将可能不回答你的问题,但我希望这是有用的人。比较它们香草BLAS/特点是可扩展性。,他们的表现是一个因素的2-3个更好的在我的特别使用情况。我用它对密集的非对称的复杂的矩阵,用于线性解决和特征系统的计算。你应该知道的功能的声明 相同的香草的程序。这需要大量的预处理宏请允许我以自由切换两者之间的关系。特别是所有程序特点是可扩展性。在AMCL不需要工作组。这是一个主要的便利,如果AMCL是唯一的图书馆,你将使用。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top