GPUアレイで既に作成された並行プログラムを実行するにはどうすればよいですか?
-
03-07-2019 - |
質問
Erlangで記述されたニューラルネットワークがあり、240コアGPUを搭載したGeForce GTX 260カードを購入しました。グラフィックカードでこれを実行するための接着剤として CUDA を使用するのは簡単ですか?
解決
いいえ、CUDAの使用は簡単なことではありません。
CUDAプログラミングモデルは基本的にC(追加機能あり)を使用しますが、GPGPUの機能を最大限に活用するには、アルゴリズムがCUDAガイドラインに従っていることを確認する必要があります。 ( NVidia CUDAプログラミングガイドを参照)
>たとえば、合体を伴うストリーミングモードでメモリにアクセスする必要がある最高のメモリパフォーマンス(約70 Gbps)を得るためには、GPUのブランチは非常にコストがかかるため、条件をできるだけ避ける必要があります。 SDKで提供されるガイドとサンプルをご覧ください。これらは優れた出発点となります
他のヒント
Erlangでこれを行う方法を教えていただければ幸いです; ;-)、少なくとも、MS ResearchのSatnam SinghはHaskell(Lava)とF#で非常に興味深い仕事をしてきました。おそらく、このペーパーは、それがどのように行われるかについての直観を与えることができます:
所属していません StackOverflow