문제

누구든지 두 가지 모두에 대한 경험이 있습니까? 인텔 수학 커널 라이브러리 그리고 AMD 수학 핵심 라이브러리? 저는 고성능 통계 계산을위한 개인용 컴퓨터를 구축하고 있으며 구매할 구성 요소에 대해 토론하고 있습니다. AMD Math Core Library의 매력은 무료이지만 학계에 있으므로 MKL은 비싸지 않습니다. 그러나 나는 다음에 대한 의견을 듣는 데 관심이 있습니다.

  1. 더 나은 API를 제공하는 것은 무엇입니까?
  2. 라이센스 및 하드웨어 비용을 포함하여 평균 1 달러당 더 나은 성능을 제공합니다.
  3. 입니다 AMCL-GPU 내가 고려해야 할 요인?
도움이 되었습니까?

해결책

Intel MKL 및 ACML은 유사한 API를 가지고 있지만 MKL은 BLAS (및 CBLA)/LAPACK/FFTS/VECTOR 및 통계적 수학/스파 스 직접 및 반복적 인 솔버/스파 스 BLA 등의 더 풍부한 지원 기능 세트를 가지고 있습니다. Intel MKL은 Intel 및 AMD 프로세서 모두에 최적화되어 있으며 도움이나 안내를 위해 활성 사용자 포럼이 있습니다. 두 라이브러리에 대한 독립적 인 평가가 여기에 게시됩니다.http://www.advancedclustering.com/company-blog/high-performance-linpack-on-xeon-5500-v-opteron-2400.html)

• Shane Corder, Advanced Clustering (HPCWire : 벤치 마크 도전 : Nehalem vs Istanbul) :“최근 테스트와 실제 경험을 통해 인텔 컴파일러와 인텔 수학 커널 라이브러리 (MKL)가 일반적으로 최고의 성능. Intel의 툴킷에 정착하는 대신 Intel, GNU 컴파일러 및 Portland Group을 포함한 다양한 컴파일러를 시도했습니다. 또한 MKL, AMD Core Math Library (ACML) 및 Libgoto를 포함한 다양한 선형 대수 라이브러리를 테스트했습니다. 모든 테스트는 인텔 컴파일러와 인텔 수학 라이브러리 (AMD 시스템)를 모두 사용할 때 가장 높은 성능을 달성 할 수 있음을 보여 주었으므로이를 벤치 마크의 기반으로 사용했습니다.” [벤치 마크 테스트는 99.4GFS에서 74.0GF vs. 이스탄불 2435 2.6GHz에서 4 코어 Nehalem X5550 2.66GHz를 보여 주었다. 이스탄불은 50% 더 많은 코어에도 불구하고 34% 더 빠릅니다

도움이 되었기를 바랍니다.

다른 팁

실제로 ACML에는 두 가지 버전의 Lapack 루틴이 있습니다. 빅터가 말한 것처럼 빅터가 말한 것처럼 C-Version 루틴은 C-Version 루틴입니다. Victor가 말했듯이 작업 영역 배열이 필요하지 않으며 매개 변수에 대한 참조 대신 값을 전달할 수 있습니다. 그러나 밑줄이있는 사람은 바닐라 포트란 루틴 일뿐입니다. libacml_dll.dll에서 "덤프 빈 /내보내기"를 수행하면 볼 수 있습니다.

나는 BLAS/LAPACK 루틴에 AMCL을 사용 했으므로 이것은 아마도 당신의 질문에 대답하지 않을 것이지만, 누군가에게 유용하기를 바랍니다. 그들을 바닐라 블라스/라크와 비교하면 그들의 성능은 나의 특정 사용 사례에서 2-3의 더 나은 요소였습니다. 나는 선형 해결 및 고유 시스템 계산 모두에 밀집된 비대칭 복합 매트릭스에 그것을 사용했습니다. 함수 선언이 있음을 알아야합니다 ~ 아니다 바닐라 루틴과 동일합니다. 이를 위해서는 상당한 양의 사전 처리기 매크로가 필요하여 둘 사이를 자유롭게 전환 할 수있었습니다. 특히 AMCL의 모든 라크 루틴에는 작업 어레이가 필요하지 않습니다. AMCL이 사용할 유일한 라이브러리 인 경우 이것은 큰 편의입니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top