質問

Intel Math Kernel Library AMD Math Core Library ?高性能の統計計算用のパーソナルコンピューターを構築しており、購入するコンポーネントについて議論しています。 AMD Math Coreライブラリーの魅力は無料であるということですが、私は学界にいるので、MKLはそれほど高価ではありません。しかし、私は次のことについて考えを聞くことに興味があります:

  1. より良いAPIはどれですか?
  2. ライセンスおよびハードウェアコストを含め、平均して1ドルあたりのパフォーマンスが向上します。
  3. AMCL-GPU は考慮すべき要素ですか?
役に立ちましたか?

解決

Intel MKLとACMLには類似のAPIがありますが、MKLには、BLAS(およびCBLAS)/ LAPACK / FFTs / VectorおよびStatistics Math / Sparse direct and iterative solvers / Sparse BLASなど、サポートされる機能の豊富なセットがあります。インテルMKLは、IntelプロセッサーとAMDプロセッサーの両方に最適化されており、ヘルプやガイダンスを参照できるアクティブなユーザーフォーラムがあります。 2つのライブラリの独立した評価はここに投稿されています:( http://www.advancedclustering.com/company-blog/high-performance-linpack-on-xeon-5500-v-opteron-2400.html

•シェーンコーダー、高度なクラスタリング(HPCWire:Benchmark Challenge:Nehalem Versus Istanbul)最高のパフォーマンスを提供します。 Intelのツールキットに単に収まるのではなく、Intel、GNUコンパイラ、Portland Groupなどのさまざまなコンパイラを試しました。また、MKL、AMD Core Math Library(ACML)、テキサス大学のlibGOTOなど、さまざまな線形代数ライブラリをテストしました。すべてのテストで、IntelコンパイラとIntel Math Libraryの両方を使用すると、AMDシステムでも最高のパフォーマンスを達成できることが示されたため、これらをベンチマークのベースとして使用しました。” [ベンチマークテストでは、74.0GFで4コアのNehalem X5550 2.66GHzと99.4GFでイスタンブール2435 2.6GHzを示しました。イスタンブールはコアが50%増加しているにもかかわらず34%速い]

これがお役に立てば幸いです。

他のヒント

実際、ACMLにはLAPACKルーチンの2つのバージョンがあります。末尾にアンダースコア(_)がないものはCバージョンのルーチンです。Victorが言ったように、ワークスペース配列は不要で、パラメーターの参照の代わりに値を渡すことができます。ただし、アンダースコアが付いているものは単なるバニラFortranルーチンです。 " dumpbin / exports"を実行しますlibacml_dll.dllに表示されます。

AMCLをBLAS / LAPACKルーチンに使用しているので、これはおそらくあなたの質問に答えないでしょうが、誰かにとって役に立つことを願っています。それらをバニラBLAS / LAPACKと比較すると、私の特定の使用例では、パフォーマンスは2〜3倍向上しました。線形解と固有システム計算の両方で、高密度の非対称複素行列に使用しました。関数宣言はバニラルーチンとは同一ではないことを知っておく必要があります。これには、2つの間を自由に切り替えることができるように、かなりの量のプリプロセッサマクロが必要でした。特に、AMCLのすべてのLAPACKルーチンは作業配列を必要としません。 AMCLが使用する唯一のライブラリである場合、これは大きな利便性です。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top