سؤال

ما الذي يجب على الأقل أن يفعله نظام مراقبة صحة التطبيق لك (المطور) و/أو رئيسك (مدير تكنولوجيا المعلومات) و/أو موظفي العمليات (تحت الطلب)؟

ماذا يجب أن تفعل فوق الحد الأدنى من المتطلبات؟

هل مراقبة تطبيقات "البنية التحتية" (ms-exchange وApache وما إلى ذلك) كافية أم أن تطبيقات المستخدم الفردية ومواقع الويب وقواعد البيانات تحتاج أيضًا إلى المراقبة؟

إذا كان الأخير، ماذا تريد أن تعرف عنهم؟

إضافة:شكرًا على مساهمتك، كنت أبحث حقًا عن مراقبة مستوى التطبيق وليس مراقبة البنية التحتية، ولكن من الجيد معرفة كليهما

هل كانت مفيدة؟

المحلول

  • ما إذا كان التطبيق قيد التشغيل.
  • استخدام غير عادي لوحدة المعالجة المركزية/الذاكرة/الشبكة.
  • قم بالإبلاغ عن أي استثناءات لم تتم معالجتها.
  • حالة الوحدات المختلفة (إن أمكن).
  • حالة المكونات الخارجية (قواعد البيانات، خدمات الويب، خوادم الملفات، إلخ.)
  • عدد مهام الخلفية المعلقة (إن أمكن).
  • ربما تتبع استخدام التطبيق وتبلغ عن إحصائيات حول الوظائف الأكثر/الأقل استخدامًا حتى تعرف أين تكون التحسينات أكثر فائدة.

نصائح أخرى

الجواب هو، فإنه يعتمد'.لماذا تحتاج إلى المراقبة؟ما هو حجم موظفي العمليات لديك؟هل تحتاج إلى الإبلاغ؟ما هي بيئة التطبيق؟من يهتم إذا فشل التطبيق؟من يهتم إذا حدث استثناء؟هل يمكن استرداد أي من الأخطاء؟يمكنني أن أطرح أسئلة كهذه لفترة طويلة.

سؤال عظيم.

لقد كنا نبحث عن بعض حلول المراقبة على مستوى التطبيق لتلبية احتياجاتنا منذ بعض الوقت دون أي حظ.إن حلول المراقبة الشائعة موجهة في الغالب لمراقبة البنية التحتية، وهي - في رأيي - معقدة للغاية بالنسبة لمتطلبات معظم الشركات الصغيرة والمتوسطة الحجم.

لقد طلبنا (بشكل رئيسي) الميزات التالية:

  • التنبيهات - أردنا أن نعرف عن الحادث بأسرع ما يمكن
  • الإدارة غير المؤلمة - الخدمة المستضافة ستكون الأفضل
  • التصورات - من الجيد معرفة ما يجري واستخلاص بعض المعرفة من البيانات

لأننا لم نجد الحل المناسب بدأنا في كتابة الحل الخاص بنا.أخيرًا، انتهينا من خدمة التشغيل التي تسمى تنبيهGrid.(يمكنك التحقق من ذلك مجانًا بالطبع.)

الفكرة وراء ذلك هي توفير طريقة سهلة للتعامل مع سيناريوهات المراقبة المخصصة.واجهة برمجة التطبيقات للتكامل بسيطة جدًا (وظيفة واحدة تحتوي على معلمتين مطلوبتين).في الوقت الحالي نستخدمه نحن وآخرون من أجل:

  • مراقبة المهام المجدولة (وظائف كرون)
  • مراقبة تنفيذ منطق التطبيق بأكمله
  • التنبيه على الأخطاء في التطبيقات
  • نحن نعمل أيضًا على أمثلة لمراقبة البنية التحتية الأساسية باستخدام AlertGrid

هذا سؤال مفتوح، لكنني سأبدأ بالقياسات الفيزيائية.
1.هل جميع الأجهزة التي أعتقد أنها تستضيف هذا الموقع قابلة لاختبار الاتصال؟
2.هل جميع الأجهزة التي ينبغي أن تقدم المحتوى تخدم في الواقع بعض المحتوى؟(من الأفضل أن يتم ذلك من شبكة خارجية.)
3.هل يتم تشغيل كل خدمة متوقعة على كل جهاز؟
3 أ.هل تم تشغيل هذه الخدمات مؤخرًا؟
4.هل يوجد في كل جهاز مساحة على القرص الصلب؟(لا تنسى ديسيبل)
5.هل تم عمل نسخة احتياطية لهذه الآلات؟متى كانت آخر مرة؟

بمجرد أن يحدد المرء المراقبة المادية للأنظمة، يمكن للمرء أن يتناول تلك الخاصة بالنظام؟

1.هل يمكن للبرنامج النصي الآلي تسجيل الدخول؟كم من الوقت استغرقت؟
2.كم عدد المستخدمين الذين يعيشون؟هل تمت إضافة مليون حساب مزيف؟
...
تصبح هذه الأنواع من الأسئلة أكثر غموضًا، ويمكن أن تكون خاصة بالنظام.كما يمكن عادةً استخلاصها بشكل تفاعلي عند الاستجابة للقياسات الفيزيائية.امتلأ القرص الصلب، ربما امتلأت سجلات خادم الويب لأن مجموعة من العملاء أنشأوا عددًا كبيرًا جدًا من المستخدمين المزيفين.هذا النوع من الشيء.

على الرغم من أن الخطة "أ" لا ينبغي بالضرورة أن تكون تفاعلية، إلا أن هذه هي الطريقة التي يقوم بها العديد من المواقع بإعداد نظام المراقبة.

الحد الأدنى:تأكد من تشغيله :)

ومع ذلك، بعض الأشياء الأخرى ستكون مفيدة للغاية.على سبيل المثال، تحميل وحدة المعالجة المركزية واستخدام ذاكرة الوصول العشوائي و(في الأنظمة متعددة المستخدمين) أي مستخدم يقوم بتشغيل ماذا.وأيضًا، بالنسبة للتطبيقات التي تصل إلى الشبكة، قائمة اتصالات الشبكة لكل تطبيق.و(إذا كان لديك حق الوصول إلى أجهزة الكمبيوتر العميلة)) سيكون من الرائع أن تتمكن من رؤية "عنوان النافذة" للتطبيق - ربما تحقق كل 2-3 دقائق إذا تغير واحفظه.بالإضافة إلى ذلك، قد تكون قائمة الملفات التي يفتحها التطبيق مفيدة جدًا، ولكنها ليست ضرورية.

أعتقد أن هذا أمر بسيط إلى حد ما - قم بالمراقبة بحيث يمكن تحذيرك في وقت مبكر بما فيه الكفاية قبل أن يحدث خطأ ما.وهذا يعني مراقبة التبعيات والتطبيق نفسه.

من الصعب حقًا تقديم تفاصيل إذا كنت لن تقدم تفاصيل حول التطبيق الذي تراقبه، لذلك أقول استخدم ذلك كقاعدة عامة.

على الأقل تريد أن تعرف أن النظام سليم.هذا أمر شخصي فيما يحدد أن نظامك صحي.هل تم تشغيل أجهزة الكمبيوتر، أم أن الموارد اللازمة موجودة، أم أن البيانات تتدفق عبر النظام، أم أن البيانات تنتج النتائج بشكل صحيح، وما إلى ذلك، وما إلى ذلك.

في مشروعي نقوم بمراقبة معظم هذا ثم بعضًا منه.يتعلق الأمر حقًا بأعلى مستوى يمكنك استخدامه لتحليل أن كل شيء يعمل.في حالتنا نحن بحاجة إلى معرفة وصولا إلى إخراج البيانات.إذا كنت بحاجة فقط إلى معرفة ما هي هذه الأجهزة، فهذا يوفر عليك محاولة إظهار الخطأ لمستخدم نهائي عديم الخبرة.

هناك أيضًا أدوات "جاهزة للاستخدام" ستؤدي الكثير من العمل الشاق نيابةً عنك إذا كنت تبحث بجهد شديد في نتائج البيانات.أعجبني بشكل خاص ناجيوس عندما كنت أنظر حولي ولكننا كنا بحاجة إلى أكثر مما يمكن أن يظهر بسهولة لذلك كتبت نظام المراقبة الخاص بنا.في الأساس، نراقب أيضًا "الميزات" في النظام، والذاكرة/وحدة المعالجة المركزية، وما إلى ذلك ...

شكرًا للجميع على المدخلات، كنت أبحث حقًا عن مراقبة مستوى التطبيق وليس مراقبة البنية التحتية، ولكن من الجيد معرفة كليهما

والفرق هو:

  • ستكون مراقبة البنية التحتية عبارة عن خوادم بالإضافة إلى MS Exchange Server وApache وIIS وما إلى ذلك
  • مراقبة التطبيقات ستكون أجهزة المستخدم والبرامج المحددة التي يستخدمونها للقيام بوظائفهم، و/أو الخوادم بالإضافة إلى تطبيقات نقل البيانات/الخلفية التي يقومون بتشغيلها للحفاظ على تدفق البيانات

في بعض الأحيان يكون من الصعب رسم خط فاصل - قد يكون التعريف المبسط هو "إذا كتبه فريقك، فهو تطبيق؛إذا اشتريتها، فهي بنية تحتية"

أعتقد أنه من الأفضل من الناحية العملية مراقبة كليهما

ما عليك القيام به هو تقسيم العملية التجارية للتطبيق ومن ثم جعل البرنامج يصدر الأحداث في مكونات الأعمال الرئيسية.بالإضافة إلى ذلك، ستحتاج إلى إنشاء معاملات تركيبية شاملة (على سبيل المثال.محاكاة المستخدمين النهائيين الذين ينقرون على موقع ويب).سيتم إدخال كل هذه البيانات في أداة المراقبة.في الماضي، قمت بتنفيذ JMX للتطبيقات التي تتدفق إلى محول JMX الخاص بـ Tivoli Monitoring، ثم قمت بتنفيذ البرامج النصية التي تنفذ "مستخدمًا مزيفًا" ثم تقوم بإدخال النتائج إلى محول البرنامج النصي الخاص بـ Tivoli Monitoring.تأخذ مراقبة Tivoli البيانات ثم تقوم بإنشاء مخططات لسلامة التطبيق والأداء من تلك البيانات الأولية.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top