سؤال

أحاول تحسين تطبيق في النمذجة ثلاثية الأبعاد في الوقت الحقيقي. يعمل الجزء الجوي من التطبيق بالكامل تقريبا على GPU في كودا. يتطلب التطبيق محلول صغير (6 × 6) مزدوج الدقة النماذج الخطية المحددة المحددة المحددة= B 500+ مرات في الثانية. حاليا يتم ذلك باستخدام مكتبة جبرية خطية مع وحدة المعالجة المركزية فعالة باستخدام Choldsky لكنها تستلزم نسخ البيانات من وحدة المعالجة المركزية - GPU والعودة إلى GPU مئات المرات في الثانية والنفقات العامة لإطلاق Kernel في كل مرة إلخ.

كيف يمكنني حساب الحل للنظام الخطي على GPU فقط دون الحاجة إلى أخذ البيانات على وحدة المعالجة المركزية على الإطلاق؟ لقد قرأت قليلا عن مكتبة الصهارة ولكن يبدو أنها تستخدم الخوارزميات المختلطة بدلا من خوارزميات GPU فقط.

أنا مستعد لحقيقة أن محلول نظام خطي فردي على GPU سيكون أبطأ كثيرا من المكتبة القائمة على وحدة المعالجة المركزية القائمة ولكن أريد أن أرى ما إذا كان يمكن تصنيعه من خلال إزالة اتصال البيانات بين المضيف والجهاز والنفقات العامة لإطلاق النواة وما إلى ذلك مئات المرات في الثانية الواحدة. إذا لم يكن هناك GPU فقط بديل يشبه lapack هناك كيف أذهب حول تنفيذ شيء لحل هذه الحالة 6x6 المعينة على GPU فقط؟ هل يمكن القيام بذلك دون استثمار ضخمة وقت مع مكتبات GPU Blas على سبيل المثال؟

هل كانت مفيدة؟

المحلول

NVIDIA نشر رمز للفأس المزججة= B Solver إلى موقع المطور المسجل آخر سقوط. يعمل هذا الرمز على المصفوفات العامة، وينبغي أن يعمل بشكل جيد بما يكفي لاحتياجاتك شريطة أن توسيع المصفوفات المتماثلة إلى المصفوفات الكاملة (التي لا ينبغي أن تكون مشكلة لمدة 6 × 6؟). نظرا لأن الرمز ينفذ محور محوري، وهو أمر غير ضروري للمصفوفات المحددة الإيجابية، فليس من الأمثل لحالتك، ولكن قد تكون قادرا على تعديلها لأغراضك مثل الرمز تحت ترخيص BSD.

موقع المطور القياسي في NVIDIA يعاني من بعض المشكلات في الوقت الحالي. إليك وكيف يمكنك تنزيل رمز Solver Batched Code في هذا الوقت:

(1) انتقل إلى http://www.nvidia.com/content /cuda/cuda-toolkit.html

(2) إذا كان لديك حساب nvdeveloper موجود (E.G. عبر الشركاء.nvidia.com) انقر فوق الارتباط الأخضر "تسجيل الدخول إلى NVDeveloper" على النصف الأيمن من الشاشة. خلاف ذلك انقر فوق "الانضمام إلى Nvdeveloper" للتقدم للحصول على حساب جديد؛ عادة ما تتم الموافقة على طلبات حسابات جديدة في يوم عمل واحد.

(3) قم بتسجيل الدخول في المطالبة بعنوان بريدك الإلكتروني وكلمة المرور

(4) هناك قسم على الجانب الأيمن بعنوان "أحدث التنزيلات". العنصر الخامس من الأعلى هو "الحلال المزجج". انقر فوق ذلك وسيقدم لك إلى صفحة التنزيل للرمز.

(5) انقر فوق ارتباط "التنزيل"، ثم انقر فوق "قبول" لقبول شروط الترخيص. يجب أن يبدأ التنزيل الخاص بك.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top