يمكن Hadoop أن يقتصر على تجنيب دورات وحدة المعالجة المركزية؟

StackOverflow https://stackoverflow.com/questions/1607361

  •  05-07-2019
  •  | 
  •  

سؤال

هل من الممكن تشغيل Hadoop بحيث يستخدم فقط دورات CPU الغيار؟ بمعنى آخر. سيكون من الممكن لتثبيت Hadoop على الشعوب آلات لذلك يمكن القيام به عندما لا تستخدم أجهزة الكمبيوتر الخاصة بهم أن عدد الطحن العمل، وأنها لن تعاني من استنزاف أداء واضحة (whurring المشجعين جانبا!).

وربما انها تكون مجرد حالة من إعداد JVM لتشغيل بأفضلية منخفضة وعدم استخدام "الكثير من" شبكة (على افتراض مثل هذا الشيء غير ممكن على جهاز ويندوز)؟

إذا لم يكن كذلك، لا أحد يعرف من أي مكافئات جافا لأشياء مثل BOINC ؟

وتحرير: العثور على قائمة من دورة النبش البنية التحتية هنا . على الرغم من أن سؤالي حول Hadoop لا يزال قائما.

هل كانت مفيدة؟

المحلول

وهذا كثير جدا خارج الاستخدام المقصود للHadoop. وتتوقع Hadoop كافة العقد على أن تكون متاحة بالكامل وبشبكة لسرعة الأمثل - لا شيء تحصل عليه مع محطات العمل. وعلاوة على ذلك، فإنه لا يعمل حقا حتى في ويندوز (يمكنك استخدامه مع سيغوين، ولكن أنا لا أعرف أي شخص يستخدم ذلك ل "إنتاج" - فيما عدا ما هو الأجهزة العميلة التي تصدر فرص العمل).

وHadoop يفعل أشياء مثل قطع تخزين البيانات على عدد قليل من العقد، ومحاولة جدولة كل حساب على تلك البيانات على تلك العقد. في بيئة تقاسم العمل، وهذا يعني المهمة التي يحتاج هذه البيانات تريد أن تعمل على هذه المحطات الثلاث - بغض النظر عن ما تقوم به مستخدميها في الوقت الراهن. في المقابل، مشاريع "دورة الكسح" الحفاظ على جميع البيانات في أي مكان آخر، وشحنه ومهمة لأي عقدة التي تتوفر في لحظة معينة. وهذا يتيح لها أن تكون أجمل الآلات، لكنه يتحمل تكاليف نقل البيانات واضحة.

نصائح أخرى

ولعل الطين هو شيء أكثر زقاق الخاص بك؟

الطين المنتج وصله

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top