سؤال

أنا أبحث عن المعلومات ، كيف يتم تنفيذ الدقة المزدوجة في GPU Tesla. لقد قرأت ، أن اثنين من معالجات الدفق يعملان على القيمة المزدوجة المفردة ، لكنني لم أجد أي ورقة رسمية من NVIDIA.

شكرا مقدما. PPS لماذا معظم GPU يتم حسابها بدقة واحدة فقط (لأنه يمكن تخزين الألوان كـ rr.gg.bb.tt ، حيث تكون كل حرف قيمة 8 بت)؟

ملاحظةجوجل ذلك بالنسبة لي لم يساعد

هل كانت مفيدة؟

المحلول

إن عدم دعم Double ليس مسألة تنسيق تخزين كما قلت (rr.gg.bb.tt) ولكن وجود جوادات أصلية (وأجهزة مخصصة لذلك) للتعامل مع عمليات مزدوجة (إضافة ، MUL ، MADD ، إلخ).

على أي حال ، فإن معظم GPU يدعم الدقة الفردية فقط لأنه عندما يكمن معظم سوق GPU في سوق الألعاب ولا يحتاج اللاعبون إلى دقة مزدوجة. كما يبحث معظم اللاعبين عن نسب الأداء/الأسعار الجيدة. يعد تنفيذ DP مكلفًا من حيث الميزانية الترانزستور (و TDP) ، وإذا كانت الألعاب لا تستخدم الدقة المزدوجة ، فهذا لا معنى له.

هذا هو السبب في أنك ترى وحدات معالجة الرسومات ATI المتطورة تدعم Double (HD 59xx و HD 58xx ، ولكن ليس وحدات معالجة الرسومات في منتصف ودخول مثل HD 57xx وأقل).

@karlphillip: نعم أنت على حق ، IEEE754 (نوع) ل GPU مثل GTX 260 ، ولكن جيل ATI و NVIDIA الحالي يدعم IEEE 754-2008 على الأجزاء الراقية.

حول تنفيذ الأجهزة ، هذه هي أسرار IHVs عادة لا تخبر :)

نصائح أخرى

Tesla ليست وحدة معالجة الرسومات ، إنها مجموعة من المعالجات المشتركة التي تتميز بمختلف وحدات معالجة الرسومات الراقية. إذا كان Tesla الخاص بك يحتوي على وحدة معالجة الرسومات Fermi في الداخل ، فيجب أن يكون لها أداء دقيق جيد.

انظر ورقة فيرمي الأبيض, ، صفحة 9.

تعتبر الدقة الفردية أكثر أهمية لحوسبة GPU العادية لأنها كافية لمثل هذه التطبيقات.

وفق ويكي:

للحصول على دقة مزدوجة (مدعومة فقط في وحدات معالجة الرسومات الأحدث مثل GTX 260 [12]) ، هناك بعض الانحرافات عن معيار IEEE 754: الجولة الجولة إلى الخارقة هي الوضع الداعم الوحيد المدعوم للمعاملة المتبادلة والقسمة والجذر التربيعي. في دقة واحدة ، لا يتم دعم denormals و nans. يتم دعم وضعين فقط للاتصالات IEEE (ختم وجولة إلى أخرى حتى) ، ويتم تحديدهما على أساس كل شيء بدلاً من كلمة تحكم ؛ ودقة الانقسام/الجذر التربيعي أقل قليلاً من الدقة الفردية.

هناك تذهب ، يقومون بتنفيذ معظم مواصفات IEEE 754, ، لكن التنفيذ الفعلي ربما يكون خاصًا وسريًا.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top