ما مدى أهمية الفهرسة والفهرسة المجمعة لأداء قاعدة البيانات؟

StackOverflow https://stackoverflow.com/questions/403393

  •  03-07-2019
  •  | 
  •  

سؤال

كانت هناك العديد من الأسئلة مؤخرًا حول فهرسة قاعدة البيانات والفهرسة المجمعة، وكان الأمر جديدًا بالنسبة لي حتى الأسبوعين الماضيين.كنت أتساءل عن مدى أهميتها ونوع مكاسب الأداء التي يمكن توقعها من إنشائها.

يحرر: ما هو عادة أفضل نوع من الحقول التي يجب النظر إليها عند وضع فهرس متفاوت المسافات عندما تبدأ لأول مرة؟

هل كانت مفيدة؟

المحلول

جدا جداأ(ز,ز) مهم.في رأيي، الفهرسة الحكيمة هي أهم شيء على الإطلاق في تحسين أداء قاعدة البيانات.

هذا ليس موضوعًا سهلاً لتغطيته في إجابة واحدة.تتطلب الفهرسة الجيدة معرفة الاستعلامات التي ستحدث في قاعدة البيانات، وإجراء عدد كبير من المفاضلات وفهم الآثار المترتبة على فهرس معين في محرك قاعدة البيانات المحدد.ولكن من المهم جدا مع ذلك.

يحرر: بشكل أساسي، يجب أن تكون الفهارس المجمعة عادةً ذات أطوال قصيرة.وينبغي إنشاؤها على الاستعلامات التي تعكس نطاقًا.لا ينبغي أن يكون لديهم إدخالات مكررة.لكن هذه الإرشادات عامة جدًا وليست الشيء الصحيح بأي حال من الأحوال.الشيء الصحيح هو تحليل الاستعلامات التي سيتم تنفيذها.قياس وتحليل خطط التنفيذ بعناية وفهم أفضل طريقة للقيام بذلك.يتطلب هذا سنوات من الخبرة والمعرفة، ولا يمكن بأي حال من الأحوال شرحه في فقرة واحدة.إنه الشيء الأساسي الذي يجعل خبراء قاعدة البيانات خبراء (إنه ليس الشيء الوحيد، ولكنه بدائي بالنسبة لأشياء مهمة أخرى، مثل مشكلات التزامن، والتوفر، ...)!

نصائح أخرى

والفهرسة: في غاية الأهمية. وجود مؤشرات خاطئة يجعل الاستفسارات أكثر صعوبة، وأحيانا إلى درجة أنهم لا يمكن أن تكتمل في وقت معقول.

ومؤشرات الأداء أيضا تأثير إدراج واستخدام القرص (سلبا)، وذلك تمشيا الكثير من المؤشرات زائدة حولها على جداول كبيرة هو فكرة سيئة للغاية.

وتجميع شيء يستحق التفكير، اعتقد انها تعتمد حقا على سلوك قاعدة بيانات محددة. إذا كنت تستطيع تجميع البيانات بشكل صحيح، يمكنك الحد بشكل كبير من كمية معالج ادخال و اخراج المطلوبة لتلبية طلبات الصفوف لا في الذاكرة.

وبدون الفهارس المناسبة، يمكنك إجبار RDBMS للقيام بمسح الطاولة للاستعلام عن أي شيء. غير فعالة بشكل رهيب.

ويهمني ان نستنتج ايضا ان لم يكن لديك مفاتيح أساسية، وهي خطيئة كبرى في تصميم العلائقية.

والفهرسة مهمة جدا عندما يحتوي الجدول على العديد من الصفوف.
مع عدد قليل من RWS، وأداء أفضل بدون الفهارس.
مع الجداول أكبر مؤشرات مهمة جدا للحصول على الأداء الجيد.
ليس من السهل أن تعرف لهم. مجمع يعني أنه يتم تخزين البيانات في ترتيب فهرس متفاوت المسافات.
للحصول على تلميحات جيدة من المؤشرات التي يمكن استخدامها العلجوم

الفهرسة هي ذات أهمية حيوية.

يمكن أن يؤدي الفهرس الصحيح للاستعلام إلى تحسين الأداء بشكل كبير كما يبدو السحر.

وكما قال الإجابات الأخرى، فهرسة أمر بالغ الأهمية.

وكما قد يستنتج من إجابات أخرى، فهرسة تتجمع أقل حيوية بكثير.

والفهرسة لائقة يعطيك الأولى المكاسب أداء النظام - أوامر من حجم شائعة

.

والفهرسة المجمعة هي الدرجة الثانية أو كسب الأداء تدريجيا - وعادة ما تعطي صغيرة (<100٪) النسب المئوية للزيادة في الأداء

(ونحن أيضا ندخل في مسائل "ما هو كسب الأداء بنسبة 100٪ '؛ أنا تفسير مئوية اعتبارا ((oldtime - newtime) / newtime) * 100، لذلك إذا كان الوقت القديم هو 10 ثانية والجديد الوقت هو 5 ثوان، وزيادة الأداء بنسبة 100٪).

ونظم إدارة قواعد البيانات المختلفة لها تفسيرات مختلفة لما يعنيه فهرس متفاوت المسافات. حذار. على وجه الخصوص، بعض DBMS تتجمع البيانات مرة واحدة وبعد ذلك، تجميع يضمحل مع مرور الوقت حتى يتم reclustered البيانات. تأخذ آخرون وجهة نظر أكثر نشاطا من المجموعات، على ما أعتقد.

عادةً ما يكون الفهرس المجمع هو مفتاحك الأساسي ولكن ليس دائمًا.إحدى طرق النظر إلى فهرس متفاوت المسافات هي التفكير في البيانات التي يتم ترتيبها فعليًا استنادًا إلى قيم الفهرس المتفاوت المسافات.

قد لا يكون هذا هو الحال في الواقع، إلا أن الرجوع إلى الفهارس المجمعة عادةً ما يمنحك مكافآت الأداء التالية على أي حال:

  1. يمكن الوصول إلى جميع أعمدة الجدول مجانًا عند حلها من خلال فهرس مجمع كما لو كانت موجودة ضمن فهرس التغطية.(استعلام يمكن حله باستخدام بيانات الفهرس فقط دون الحاجة إلى مراجعة صفحات البيانات الخاصة بالجدول نفسه)

  2. يمكن إجراء عمليات التحديث مباشرة مقابل فهرس متفاوت المسافات دون معالجة وسيطة.إذا كنت تجري الكثير من التحديثات على جدول ما، فأنت تريد عادةً مراجعة الأعمدة المجمعة.

  3. اعتمادًا على التنفيذ، قد تكون هناك فائدة وصول تسلسلي حيث يتم استرداد البيانات المخزنة على القرص بشكل أسرع مع عمليات بحث أقل تكلفة على القرص.

  4. اعتمادًا على التنفيذ، قد تكون هناك فائدة فهرس مجانية حيث لا يكون الفهرس الفعلي ضروريًا حيث يمكن حل الوصول إلى البيانات عبر خوارزميات لعبة التخمين البسيطة.

لا تعتمد على رقم 3 وخاصة رقم 4.يعد رقم 1 ورقم 2 رهانات آمنة عادةً على معظم منصات RDBMS.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top