質問

いハードウェアなどを運営してい256の演算集中型の 実時間 兼業務を24時間モード(マルチスレッドCうものとします。各タスクの約40-50MFLOPs、すべてのタスクを必要と約10GFLOPs.CPU-RAM速度は軽微であります。すべてのタスクを管理する必要があるLinuxカーネル(32ビット、SMP).

いつからマザーボードでの解決のマルチコアCPUばなCPU)に属していることがわかって.ない場合CPUは存在しない、その必要mulit-ソケットからマザーボードソリューション(複数のCpu).

ありがとうございます。をお勧めしくだプロのCPU/マザーボードソリューションシスが要求?でも非常に重要な課題とLinuxカーネル(2.6.25).な仮想化、ニーズの巨大なRAMまたはCPUます。もうインテル-アーキテクチャおよび"が表示されており、安定まだまだ疑問いることが可能です。

よろしくお願いします。

更新:私た正解 こちらのこちらの.

役に立ちましたか?

解決

UltraSPARC T2 8コア8スレッドです。統合型の高帯域幅をメモリおよびIO.の T5140 行っ128ハードウェアスレッド)。

理論最大原の性能の8つの浮動小数点ユニット11ギガプ/秒(GFlopsめてまいります。て非常に大きなその他の実装を取得した64のスレッドの共有が可能単位であることを実現できる極めて高い割合の理論的なピークでした。当社の実験を達成しているものが全体の90%近くを占め、11Gflop/sとなります。-(http://blogs.oracle.com/deniss/entry/floating_point_performance_on_the)

他のヒント

  1. 家賃の一部Amazon EC2ノード。

  2. 更新:いかがPS3のでしょうか?NASAとして使用すシミュレーションエンジンです。

  3. も利用CPU+GPUの商用サーバー?

  4. を構築しするようにしてください Fpga:現在では一部異などのプロセッサの実行可能なインプリメンテーションです。

あなたは私たちにあなたが必要だと思うの仕様を与えてくれたにもかかわらず、

、我々はあなたがアプリケーションを達成するために意図されているものを教えている場合、より良いあなたを助けることができるかもしれない、とどのようにそれが実装されました。

むしろあなたの現在のソリューションよりも、仕事を分割したり、それに対処するためのより良い方法があるかもしれません。

未Intelアーキテクチャが、これらの実行Linuxと単一のダイの上に64個のコアを持っています。

4または8コアのマシンの束を取得し、グリッドやクラスタリングソフトウェアのいくつかの並べ替えを使用しているマシン間で処理を分割します。たぶん見てベオウルフするます。

あなたが述べたように、10GFlopsはまさにそう単一のマシン内でくしゃみをすることはありませんが、それは高価になることでしょう。機械の破損は、あなたが利用できる同様のスペックの第二のマシンを持っている可能性は低いしているとき、あなたは何をすべきかという問題もあります。あなたはコモディティ・ハードウェアを使用して、クラスタを構築する場合、あなたはもう少し弾力的だし、それは、交換機を見つけることが簡単です。

MFLOPSとGFLOPSは、プログラムは、任意のCPU上で実行することができますどれだけの非常に悪い指標です。最近では、キャッシュ・フットプリントがはるかに重要です。おそらく、分岐予測精度のほかます。

実際にスピンを与えることなく、異なるアーキテクチャ上の特定のアプリケーションのパフォーマンスを測定するためのほとんどの方法があります。あなたが無意識のうちに百他のもののいずれかをお使いのキャッシュ・フットプリントを台無しにし、または不正なスレッドライブラリを使用、またはコンパイラオプションでビルドするのに十分な不運だった場合でも、その後、あなたは良いアイデアを取得できない場合があります。

私はあなたがインテルを好む見ていますが、一つのチップが必要な場合、私は再びセルプロセッサを提案します - その理論ピーク性能はarount 25GFlopsです - カーネル2.6.25はすでにそれをサポートしていました。

あなたは、再書き込みおよび微調整あなたのスレッドに取る必要があります -

あなたは(それは少しあなたの費用がかかります)、または自分で米国は約$ 8Kでのサーバーベースのソリューションを取得で実験用に事前スリムプレイステーション3を試みることができますそこSPUコプロセッサのadvabtageていますが、単一のセルで汗を壊すことなく、あなたの計算の必要性を達成できる(1つのPPCコア+ 8 SPUの)

NB:プレイステーション3で、あなたは、コプロセッサのみ6が利用できる必要があるだろう - しかし、あなたは、このプロジェクトでの予算上にあるように見えません - だから、少なくとも、あなたがそれを実行するためにあなたのソリューションをコーディングすることができるかどうかを確認するために、エミュレータを提供していますIBMのセルの開発キットを、試みることができます。

THREスタンドアロンサーバーとして、両方のブレードフォーム工場では、市販の細胞産物であり、PCI Expressは、アドオンからPCワークステーション用のボード マーキュリーコンピュータシステムズ: http://www.mc.com/microsites/cell/products。 aspxの?ID = 6986

水星は、サイト上の任意の価格が表示されませんが、価格は、これらのPCI Expressカードのための$ 8000.00 Uを述べprevioulsyの周りにあることをseens。

プレイステーション3のビデオゲームは、Uの約$ 300.00のために購入することができます - あなたはあなたのアプリケーションのプロトタイプを作成し、それが必要なパフォーマンスまであるかどうかを確認することができるようになります。 (私自身は1つを得たと私は、これまでのところ、すべての計算のためにそれを使用していないとhobbystようことでしたが、Fedora 9のその上で実行されている - 私も一緒に、分子シミュレーションのためのプレイステーション3 12 machinneクラスタを入れていました大学ローカル。私は、その後に連絡をしながら、彼らが実行するアプリケーションは、マルチメディアSPUのを利用しませんでした。しかし、そうであっても、3.5GHzのでクロックは、標準よりも良好に機能し、imlarlyでもPS3年代が5倍価格です考えると、PCの値を付けsの高いこの辺り)

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top