質問

もんね、googleいて、なぜすることは可能で銀行の紛争と共有メモリ、グローバルメモリ?エにあるこの銀行の紛争とレジスタ?

更新 Wowの皆さんには本当に感謝している"との回答からTibbitおよびグリズリー.えるようですがみえて緑のチェックマークを一つの答えになってる。私newishスタックオーバーフロー.思いに答えて最高です。できませんのご来場、ありがとうござい答えんグリーンチェック。

役に立ちましたか?

解決

答え: ありません銀行の紛争はグローバルメモリに登録する

説明:

同時に、理由のため、粒度の事業です。単一のスレッドにアクセスしない世界。グローバルメモリアクセス"凝集した".以降、グローバルメモリは礼儀正しい文章は、他のアクセスに関するスレッド内でブロックのグルーピングとしてのグローバルメモリとして可能です。

共有メモリにアクセスできるスレッドが同時にがスレッドのみにアクセスするアドレスを同一の銀行では、この原因は、銀行の対立する。

レジスタにアクセスできないスレッド以外のもので割引いて算出しております。にすることができるのではな読み込みまたは書き込みに私のレジスタは、ブロックできませんからのアクセスしてい--でもない銀行です。

できる人の読込と書込みをグローバルメモリ?

Only blocks.単一のスレッドでアクセスが、すでに取引の処理のブロックレベルの際にはwarp/半warpレベルがないようにしているが複雑にな).の場合はブロックアクセスと同じメモリー、Iということなのではないが発生する恐れがあると加速するL1キャッシュ最新のデバイスがこない透過的に明らかです。

での読み取り、書き込みを共有メモリ?

Any thread within a given block. いただけるお客様には1スレッド数ブロックできない銀行は、紛争なんて合理的な性能。銀行の紛争が起こることをブロックが割り当てについ512スレッドがそれらはすべて奪い、個々の銀行は、まったく同じアドレス)ある優れた写真のこれらの紛争末のCUDA Cプログラミングガイド--図G2ページ167(実際にページ177をいただきます。 リンクバージョン3.2

できるために必要な様々な部品を集めた書き込みレジスタ?

Only the specific thread to which it is allocated. そのためだけのスレッドがアクセスす。

他のヒント

がついていないかどうかで銀行の紛争に与えられたタイプの記憶は明らかに依存構造に関するメモリのための目的です。

ではなぜこんなが共有メモリ方法でデザインを可能にする銀行引く紛争を止められるのか

私が比較的簡単で、容易ではないデザイン-メモリコントローラに対応できる独立したアクセスには同じメモリを同時にもあることからわかるようにもできない).そのため、各スレッドにhalfwarpアクセスindividualyつの単語の記憶はbanked、独立したコントローラの各銀行(少なくとも私がどのように取り組むべきかのことを考えれば、必要な場合は実しているページがあります。これらの銀行はインターリーブ方式を逐次のスレッドにアクセス順次メモリです。なのでこれらの各銀行に対応できるの申込時に理想的を兼執行の要求がすべてのhalfwarpろに、このモデルで理論的に維持しより高い帯域幅によりその独立性の銀行でもある。-

うレジスタ?

レジスタに設計することを目的とするものではオペランドとして用ALU指示の意味を持つと言われていたが、アクセスの非常に低いものの待ち時間をゼロにすることにこれよりトランジスタ/トを作ることが可能です。なんなのか教えてほしいレジスタにアクセスには現代のプロセッサ(な種類の情報は必要なくなることが簡単に行います。しかしもちろん高unpracticalを登録銀行(シュではすべてのレジスタに吊る一つの大きなマルチプレクサ).いいえ、ありませんの銀行の紛争のために登録する

グローバルメモリ

まずはグローバルメモリすることが多いgranualityして共有メモリ。メモリアクセス32,64または128byteブロック(GT200転、フェルミで128Bは常に、キャッシュされ、AMDメセニー-グループのコンサート、見たいから何かのブロックをブロックにアクセス/転送します。ではなぜ必要な凝集したアクセス、すべてのスレッドにアクセスメモリからブロックまでのすべてのブロックとなります。

がっていない銀行に引く紛争を止められるのかいないこというな実際の源への支援のためのNVIDIAハードウェアうですが、論理関数:のグローバルメモリは、一般的に配布数ramチップを容易に認識できるように見るgraphicscard).ことができるとされていることの意味で、場合にそれぞれのチップは、銀行のように地域の記憶なのですが銀行の紛争が複数ある場合はリクエストに応答と同じ。しかし、効果をもったひとつの(ほとんどの時間を消費するメモリアクセスの遅延のためのデータを取得られっ、できな効果noticible"内"のワークグループ(年唯一halfwarp実行時にそhalfwarp問題を要求していuncoalescedメモリアクセスしていただく必要があり、既にヒットでの測定に影響する。くだけなので、紛争の場合複数の作してみアクセスしてください。お典型的な状況のgpgpuい模様の添い寝に順次メモリの効果なんですnoticibleかったことがありその他の作accessinngその他の銀行と同時に、動きの構築状況のデータセットが中心で行うためのヒット帯域幅(最大帯域からequaly配信アクセスのすべての銀行は、各銀行だけで満たないこと帯域幅).再び私に何かを証明するための理論nvidiaハードウェア(主にもfocussesに律があるものにでますます重要となっていることが、nonproblem自然データセットです。しかしによるATIストリーム計算ガイドのこのような状況にあるためRadeonカード(5xxx:銀行は2kb除したいことを確認すすアクセスを意味するからすべてのworgroups simulateously)equalyに渡って行うので、いう、NVidiaのカードの動作similary.

もちろんほとんどのscenariousの可能性銀行の紛争がグローバルメモリは、その練習と言ってもいいでしょう:

  • 時律でアクセス時にグローバルメモリ
  • 腕時計用銀行の紛争にアクセス時に地域の記憶
  • 問題のないレジスタにアクセス

複数のスレッドにアクセスと同銀行ったことにはなりませんが銀行に対立する。矛盾がある場合のスレッドが読みたいと同時に異なる行に同行。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top