سؤال

أنا أبحث عن أجهزة، والتي يجب تشغيل حوالي 256 مكثفة حسابية في الوقت الحالى المهام المتزامنة في وضع 24 ساعة (تطبيق واحد متعدد الخيوط). تستغرق كل مهمة حوالي 40-50 mflops، لذلك تتطلب جميع المهام حوالي 10 Gblops. سرعة CPU-RAM ضئيلة. يجب إدارة جميع المهام بواسطة Kernel Linux (32 بت، مع SMP).

أنا أبحث عن حل لوحة واحدة مع وحدة المعالجة المركزية متعددة النواة واحدة (إذا كانت هذه وحدة المعالجة المركزية موجودة). إذا لم يكن هذا وحدة المعالجة المركزية هذه غير موجودة، فأنا بحاجة إلى حل اللوح Mulit-Socket واحد (مع وحدة المعالجة المركزية المتعددة).

هل يمكنك أن تنصحني بأي حل محترف / لوحة CPU / التي سوف ترضي هذه المتطلبات؟ من المهم أيضا أن لا توجد مشكلات مع نواة Linux (2.6.25). لا توجد محاكاة افتراضية، لا احتياجات في ذاكرة الوصول العشوائي الضخمة أو CPU ذاكرة التخزين المؤقت. أنا أيضا أفضل بنية إنتل واستقرار مثبتا جيدا. لا يزال لدي شكوك بأنها ممكنة على الإطلاق.

شكرا لكم مقدما.

تحديث: أعتقد أنني وجدت الإجابة الصحيحة هنا و هنا.

هل كانت مفيدة؟

المحلول

ultrasparc t2. لديه 8 النوى مع 8 خيوط لكل منهما. الذاكرة المتكاملة عالية النطاق الترددي و io. ال T5140. يحمل اثنان منهم لمدة 128 خيط الأجهزة.

يعد أداء ماكس النظري النظري لوحدات النقطة العائمة 8 11 جيجا في الثانية (GLOPS / S). هناك ميزة كبيرة على التطبيقات الأخرى هي أن 64 مواضيع يمكن أن تشارك الوحدات وبالتالي يمكننا تحقيق نسبة عالية للغاية من الذروة النظرية. حققت تجاربنا ما يقرب من 90٪ من 11 Gflop / S. -http://blogs.oracle.com/deniss/entry/floating_point_performance_on_the.)

نصائح أخرى

  1. استئجار بعض العقد الأمازون EC2.

  2. محدث: ماذا عن PS3 إذن؟ تستخدمها ناسا لمحركات المحاكاة الخاصة بهم.

  3. ربما استخدم CPU + GPU في الخوادم التجارية؟

  4. بناء عليه FPGAS.: في الوقت الحاضر، تشمل بعض المتغيرات المعالجات التي يمكن أن تعمل Linux.

على الرغم من أنك قد أعطيتنا المواصفات التي تعتقد أنها تحتاج، فقد نكون قادرين على مساعدتك بشكل أفضل إذا أخبرنا ما يهدف إليه التطبيق بإنجازه وكيف تم تنفيذها.

قد تكون هناك طريقة أفضل لتقسيم العمل أو التعامل معها بدلا من حلك الحالي.

ليس Intel Architecture ولكن هذه تشغيل Linux ولها 64 نوى على يموت واحد.

tilepro64.

احصل على مجموعة من أجهزة أربع أو ثمانية أساسية وتقسيم المعالجة عبر الأجهزة باستخدام نوع من البرامج البرامج أو التجميع. ربما إلقاء نظرة على Beowulf..

كما ذكرت، لا تتخطى 10GFlops بالضبط في آلة واحدة، وسوف تكون مكلفة. هناك أيضا مشكلة ما تفعله عندما يكسر الجهاز، من غير المرجح أن يكون لديك آلة ثانية من المواصفات المتشابهة المتاحة. إذا قمت ببناء كتلة باستخدام أجهزة السلع الأساسية، فأنت أكثر مرونة قليلا ومن الأسهل العثور على آلات بديلة.

MFLOPS و GLOPS هي مؤشرات سيئة للغاية حول حجم البرنامج يمكن تشغيله على أي وحدة المعالجة المركزية معينة. في هذه الأيام، فإن بصمة التخزين المؤقت أكثر أهمية. ربما دقة التنبؤ الفرعي كذلك.

لا توجد طريقة تقريبا لقياس أداء تطبيق معين على بنية مختلفة دون إعطائها فعليا تدورا. وحتى بعد ذلك، قد لا تحصل على فكرة جيدة إذا كنت محظوظا بما يكفي لإنشاء خيارات محول البرمجية التي دمرت بصمة التخزين المؤقت الخاصة بك، أو استخدم مكتبة خيوط سيئة، أو أي من مائة شيئ أخرى.

أرى أنك تفضل أنك تفضل Intel، ولكن إذا كنت بحاجة إلى شريحة واحدة، فسوف أقترح مرة أخرى معالج الخلية - أداء ذروة النظري هو arount 25gflops - Kernel 2.6.25 كان لديه دعم له بالفعل.

يمكنك تجربة PlayStation 3 ضئيلة مسبقا لتجربة (من شأنها أن تكلفك قليلا) أو احصل على حل يستند إلى الخادم في حوالي 8K دولار أمريكي - سيتعين عليك إعادة الكتابة والغرامة ضبط المواضيع الخاصة بك لاتخاذ advabtage المعالجات المشتركة SPU هناك، ولكن يمكنك تحقيق احتياجاتك الحسابية دون كسر عرق مع خلية واحدة (1 PPC Core + 8 سبو)

ملاحظة: مع PlayStation 3، سيكون لديك 6 معالجات مشتركة متاحة فقط - لكنك لا ترى أن تكون في ميزانية مع هذا المشروع - حتى تتمكن من تجربة طقم مطور خلية IBM على الأقل، والتي تقدم محاكي، لمعرفة ما إذا كان يمكنك رمز الحل الخاص بك لتشغيله.

هي منتجات الخلايا المتوفرة تجاريا، كخوادم مستقل في مصنع النموذج Blade، ومحطات الوظيفة الإضافية PCI Express لمحطات عمل الكمبيوتر الشخصي من أنظمة الكمبيوتر Mercury:http://www.mc.com/microsoft/cell/products.aspx؟id=6986.

لا يسرد Mercury أي أسعار على الموقع، لكن التسعير يرن في حوالي 8000.00 دولار أمريكي لبطاقات PCI Express هذه.

يمكن شراء لعبة Videogame من PlayStation 3 لحوالي 300.00 دولار - وستسمح لك بالنموذج الأولي للتطبيق الخاص بك، والتحقق مما إذا كان الأمر متروكا للأداء المطلوب. (أنا نفسي حصلت على واحدة ولديها فيدورا 9 يعمل عليها، على الرغم من أنني فعلت ذلك كهواء وليس كذلك، حتى الآن، استخدمها لأي حسابات - لقد وضعت أيضا معا لعبة Playstation-3 12 Machinne عن المحاكاة الجزيئية في الجامعة المحلية. لا يستفيد التطبيق الذي يديرونه من سبوه الوسائط المتعددة، بينما كنت على اتصال مع ذلك بعد ذلك. ولكن حتى ذلك، سجلت عند 3.5 جيجا هرتز قاموا بأداء أفضل من المعيار، بأسعار IMLarly، PC، حتى النظر في PS3 بسعر 5x أعلى هنا هنا)

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top