ما هي ابتكارات قاعدة البيانات العلائقية في السنوات العشر الماضية

https://stackoverflow.com/questions/191974

08-07-2019
|

سؤال

كان تنفيذ SQL لقواعد البيانات العلائقية موجودًا في شكله الحالي لمدة 25 عامًا (منذ النظام R و Ingres). حتى المعيار الرئيسي (الذي تم الالتزام به بشكل فضفاض) هو ANSI-92 (على الرغم من وجود تحديثات لاحقًا) يبلغ عمره 15 عامًا.

ما هي الابتكارات التي يمكنك التفكير فيها مع قواعد البيانات المستندة إلى SQL في السنوات العشر الماضية أو نحو ذلك. أنا أستثني على وجه التحديد ابتكارات OLAP ، عمودي وغيرها من الابتكارات غير العلمية (أو على الأقل غير SQL). أريد أيضًا استبعاد ميزات نوع "خادم التطبيق" وتجميعها (مثل أدوات الإبلاغ)

على الرغم من أن النهج الأساسي ظل ثابتًا إلى حد ما ، إلا أنني أستطيع التفكير في:

توافر
القدرة على التعامل مع مجموعات أكبر من البيانات
سهولة الصيانة والتكوين
دعم لأنواع البيانات الأكثر تقدمًا (Blob ، XML ، Unicode إلخ)

أي شخص آخر يمكنك التفكير فيه؟

المحلول

هاش ينضم
مُحسّنات قائمة على التكاليف (تحول إلى حد كبير كتابة الاستعلام على رأسها)
التقسيم (يتيح إدارة VLDB أفضل بكثير)
معالجة استعلام متوازية (متعددة الخيوط)
التجميع (ليس فقط التوافر ولكن قابلية التوسع أيضًا)
مزيد من المرونة في SQL وكذلك أسهل تكامل SQL مع لغات 3GL
قدرات تشخيص أفضل

نصائح أخرى

وظائف تحليلية مثل الترتيب

لست متأكدًا مما إذا كنت ترغب في تضمين حتى الابتكارات الخاصة بالبائعين (ولا أنا متأكد تمامًا من أن محركات قاعدة البيانات الأخرى لا يمكنها القيام بذلك بالفعل) ، لكن SQL Server 2005 يضيف استعلامات المعاملات المتكررة إلى لغتها. أجدهم مفيدين بشكل مثير للدهشة لتكرار البيانات الهرمية. أعتقد أن 2008 يضيف بعض الوظائف الجديدة المتعلقة بالبيانات الهرمية ، لكنني لم أنظر عن كثب.

SELECT (invoiceprice * detailweight) / SUM(weight) OVER(PARITTION BY invoice) as weighted, * 
FROM tblInvoiceDetails

وظائف النوافذ رائعة لفعل أشياء مثل المتوسطات المرجحة ، وأشياء أخرى تتطلب المؤشرات سابقًا.

حسنًا ، يمكن للمرء أن يقترح أن نقص الحركة لمدة 15 عامًا ليس مجرد علامة على عدم الابتكار ، ولكن علامة على أن قواعد البيانات مثالية تقريبًا! يحاول الكثير من الناس القيام بأشياء في التعليمات البرمجية التي يتم تنفيذها بشكل أفضل في قواعد البيانات التي تم تحسينها منذ الستينيات من القرن الماضي لتشغيلها بأسرع ما يمكن وكفاءة قدر الإمكان.

أود أن أقول أن السنوات العشر الأخيرة (1998-2008) شهدت أن منتجات RDBMS مفتوحة المصدر تصبح قابلة للحياة في عمليات النشر السائدة. تستخدم معظم شركات Fortune 500 الآن MySQL أو PostgreSQL أو غيرها من RDBMs مفتوح المصدر في مكان ما في مؤسستها ، حتى لو كانت تستخدم أيضًا واحدة من علامات RDBMs التجارية المغلقة.

هذا ليس تقدمًا تقنيًا ، لكن من الجدير بالملاحظة أن توفر محرك RDBMS مستقر ومفتوح المصدر يتيح العديد من المشاريع المبتكرة الأخرى.

أدرك أن كلا من MySQL و Postgresql كانا متاحين في وقت مبكر من عام 1995 ، لكنني أزعم أنهما لم يكونوا سائقين لعدة سنوات بعد ذلك.

جنبا إلى جنب مع قائمة أنواع البيانات الأكثر تقدمًا (Blob و XML و Unicode وما إلى ذلك) ، يجب عليك تضمين الأنواع المكانية.

صدر تمديد postgis لـ postgresql في عام 2001 ، ولكن الآن قام جميع البائعين الرئيسيين بتنفيذ الأشياء المكانية و SQL المكانية.

جنبا إلى جنب مع صعود خرائط Google وخرائط Bing و OpenLayers القدرة على عرض البيانات الجغرافية المكانية وتشغيل الاستعلامات المكانية دون الوسيطة كان لها تأثير كبير على تحليل الويب والبيانات.

أعتقد أن معظم التقدم كان في عالم الأداء - استفادة من المستنيرون والمجموعات.

أعتقد أن مجال أكبر الابتكار ربما كان في تكرار البيانات - من أجل التوفر والموثوقية. معظم المناطق الأخرى أكثر تدريجية. من خلال تحديد عقد من الزمان ، يمكنك حذف أشياء OrdBMS - القابلية للتوسعة ؛ ظهر ذلك في عام 1997.

مرخصة بموجب: CC-BY-SA مع الإسناد

لا تنتمي إلى StackOverflow