سؤال

في نظام القواعد، أو أي نظام تفكير يستنتج الحقائق عبر قواعد الاستدلال المتسلسلة للأمام، كيف يمكنك تقليم الفروع "غير الضرورية"؟لست متأكدًا من المصطلح الرسمي، ولكني أحاول فقط أن أفهم كيف يتمكن الأشخاص من الحد من تسلسل أفكارهم عند التفكير في المشكلات، في حين يبدو أن جميع المفكرين الدلاليين الذين رأيتهم غير قادرين على القيام بذلك.

على سبيل المثال، في ورقة جون مكارثي مثال لفهم اللغة الطبيعية ومشاكل الذكاء الاصطناعي التي تثيرها, ، فهو يصف المشاكل المحتملة في الحصول على برنامج للإجابة بذكاء على أسئلة حول مقال إخباري في صحيفة نيويورك تايمز.في القسم 4، "الحاجة إلى التفكير غير الرتيب"، يناقش استخدام Occam's Razer لتقييد إدراج الحقائق عند التفكير في القصة.القصة النموذجية التي يستخدمها هي قصة لصوص قاموا بإيذاء صاحب متجر أثاث.

إذا طُلب من البرنامج تشكيل "الحد الأدنى من الإكمال" للقصة في حساب التفاضل والتكامل المسند، فقد يحتاج إلى تضمين حقائق لم يتم ذكرها مباشرة في القصة الأصلية.ومع ذلك، فإنها ستحتاج أيضًا إلى طريقة ما لمعرفة متى تحد من سلسلة استنتاجاتها، حتى لا تتضمن تفاصيل غير ذات صلة.على سبيل المثال، قد ترغب في تضمين العدد الدقيق لرجال الشرطة المشاركين في القضية، وهو ما تحذفه المقالة، ولكنها لن ترغب في تضمين حقيقة أن كل ضابط شرطة لديه أم.

هل كانت مفيدة؟

المحلول

سؤال جيد.

من سؤالك، أعتقد أن ما تشير إليه بـ "التقليم" هو خطوة يتم تنفيذها لبناء النموذج السابق--أي، للحد من المدخلات المتاحة للخوارزمية لبناء النموذج.يشير مصطلح "التقليم" عند استخدامه في التعلم الآلي إلى شيء مختلف - وهو المنشور القديم خطوة، بعد بناء النموذج والذي يعمل على النموذج نفسه و لا على المدخلات المتاحة.(قد يكون هناك معنى ثانٍ في مجال تعلم الآلة، لمصطلح "التقليم". لكني لست على علم به.) وبعبارة أخرى، التقليم هو في الواقع أسلوب حرفيًا "للحد من سلسلة الاستنتاج" كما يمكنك وضعه، لكنه يفعل ذلك المنشور القديم, عن طريق استئصال مكونات النموذج الكامل (العامل)، وليس عن طريق الحد من المدخلات المستخدمة لإنشاء هذا النموذج.

من ناحية أخرى، فإن عزل أو الحد من المدخلات المتاحة لبناء النموذج - وهو ما أعتقد أنه ربما كان في ذهنك - هو في الواقع موضوع رئيسي للتعلم الآلي؛من الواضح أنه عامل مسؤول عن الأداء المتفوق للعديد من خوارزميات ML الأحدث - على سبيل المثال، Support Vector Machines (البصيرة التي تكمن وراء SVM هي بناء المستوى التشعبي ذو الحد الأقصى للهامش من مجموعة فرعية صغيرة فقط من البيانات، أي، "متجهات الدعم")، وشرائح الانحدار التكيفية المتعددة (أسلوب انحدار لا يتم فيه إجراء أي محاولة لملاءمة البيانات عن طريق "رسم منحنى مستمر واحد من خلاله"، وبدلاً من ذلك، يتم ملاءمة قسم منفصل من البيانات، واحدًا تلو الآخر واحد، باستخدام معادلة خطية محددة لكل جزء، أي "الخطوط"، وبالتالي فإن الخطوة الأصلية للتقسيم الأمثل للبيانات هي جوهر هذه الخوارزمية).

ما هي المشكلة التي تحل عن طريق التقليم؟

على الأقل بدون خوارزميات تعلم الآلة المحددة التي قمت بتشفيرها واستخدامها بالفعل - أشجار القرار، وMARS، والشبكات العصبية - يتم إجراء التقليم في البداية نموذج الإفراط في الملاءمة (نموذج يناسب بيانات التدريب بشكل وثيق لدرجة أنه غير قادر على التعميم (التنبؤ بدقة بالحالات الجديدة).في كل حالة، يتضمن التقليم إزالة العقد الهامشية (DT، NN) أو المصطلحات في معادلة الانحدار (MARS) واحدًا تلو الآخر.

ثانية، لماذا التقليم ضروري / مرغوب فيه؟

أليس من الأفضل تحديد معايير التقارب/التقسيم بدقة؟هذا لن يساعد دائما.يتم التقليم من "الأسفل إلى الأعلى"؛يتم إنشاء النموذج من الأعلى إلى الأسفل، لذا فإن ضبط النموذج (لتحقيق نفس فائدة التقليم) لا يؤدي فقط إلى إزالة عقدة قرار واحدة أو أكثر ولكن أيضًا العقد الفرعية (مثل تقليم شجرة أقرب إلى الجذع).لذا فإن إزالة عقدة هامشية قد يؤدي أيضًا إلى إزالة عقدة قوية واحدة أو أكثر تابعة لتلك العقدة الهامشية - لكن المصمم لن يعرف ذلك أبدًا لأن ضبطه أدى إلى القضاء على إنشاء المزيد من العقد في تلك العقدة الهامشية.يعمل التقليم من الاتجاه الآخر - من العقد الفرعية الأكثر تبعية (الأدنى مستوى) إلى الأعلى في اتجاه العقدة الجذرية.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top