Intel MKLとAMD Math Core Library

https://stackoverflow.com/questions/1644905

10-07-2019
|

質問

Intel Math Kernel Library と AMD Math Core Library ？高性能の統計計算用のパーソナルコンピューターを構築しており、購入するコンポーネントについて議論しています。 AMD Math Coreライブラリーの魅力は無料であるということですが、私は学界にいるので、MKLはそれほど高価ではありません。しかし、私は次のことについて考えを聞くことに興味があります：

より良いAPIはどれですか？
ライセンスおよびハードウェアコストを含め、平均して1ドルあたりのパフォーマンスが向上します。
AMCL-GPU は考慮すべき要素ですか？

解決

Intel MKLとACMLには類似のAPIがありますが、MKLには、BLAS（およびCBLAS）/ LAPACK / FFTs / VectorおよびStatistics Math / Sparse direct and iterative solvers / Sparse BLASなど、サポートされる機能の豊富なセットがあります。インテルMKLは、IntelプロセッサーとAMDプロセッサーの両方に最適化されており、ヘルプやガイダンスを参照できるアクティブなユーザーフォーラムがあります。 2つのライブラリの独立した評価はここに投稿されています：（ http://www.advancedclustering.com/company-blog/high-performance-linpack-on-xeon-5500-v-opteron-2400.html ）

＆＃8226;シェーンコーダー、高度なクラスタリング（HPCWire：Benchmark Challenge：Nehalem Versus Istanbul）最高のパフォーマンスを提供します。 Intelのツールキットに単に収まるのではなく、Intel、GNUコンパイラ、Portland Groupなどのさまざまなコンパイラを試しました。また、MKL、AMD Core Math Library（ACML）、テキサス大学のlibGOTOなど、さまざまな線形代数ライブラリをテストしました。すべてのテストで、IntelコンパイラとIntel Math Libraryの両方を使用すると、AMDシステムでも最高のパフォーマンスを達成できることが示されたため、これらをベンチマークのベースとして使用しました。＆＃8221; [ベンチマークテストでは、74.0GFで4コアのNehalem X5550 2.66GHzと99.4GFでイスタンブール2435 2.6GHzを示しました。イスタンブールはコアが50％増加しているにもかかわらず34％速い]

これがお役に立てば幸いです。

他のヒント

実際、ACMLにはLAPACKルーチンの2つのバージョンがあります。末尾にアンダースコア（_）がないものはCバージョンのルーチンです。Victorが言ったように、ワークスペース配列は不要で、パラメーターの参照の代わりに値を渡すことができます。ただし、アンダースコアが付いているものは単なるバニラFortranルーチンです。＆quot; dumpbin / exports＆quot;を実行しますlibacml_dll.dllに表示されます。

AMCLをBLAS / LAPACKルーチンに使用しているので、これはおそらくあなたの質問に答えないでしょうが、誰かにとって役に立つことを願っています。それらをバニラBLAS / LAPACKと比較すると、私の特定の使用例では、パフォーマンスは2〜3倍向上しました。線形解と固有システム計算の両方で、高密度の非対称複素行列に使用しました。関数宣言はバニラルーチンとは同一ではないことを知っておく必要があります。これには、2つの間を自由に切り替えることができるように、かなりの量のプリプロセッサマクロが必要でした。特に、AMCLのすべてのLAPACKルーチンは作業配列を必要としません。 AMCLが使用する唯一のライブラリである場合、これは大きな利便性です。

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow