سؤال


أنا أستخدم شبكة عصبية تغذية في بيثون باستخدام بكر تطبيق. للتدريب ، سأستخدم خوارزمية الانتشار الخلفية. أعلم أنه مع Neural-Networks ، نحتاج إلى الحصول على الكمية المناسبة من البيانات حتى لا نكون تحت/زيادة تدريب الشبكة. يمكنني الحصول على حوالي 1200 قالب مختلف لبيانات التدريب لمجموعات البيانات.
إذن هذا هو السؤال:
كيف أقوم بحساب الكمية الأمثل للبيانات لتدريباتي؟

نظرًا لأنني حاولت مع 500 عنصر في مجموعة البيانات واستغرق الأمر ساعات طويلة للتقارب ، فإنني أفضل ألا أضطر إلى تجربة الكثير من الأحجام. النتائج التي نقدمها في هذا الحجم الأخير ، لكنني أود العثور على المبلغ الأمثل. تحتوي الشبكة العصبية على حوالي 7 مدخلات ، و 3 عقد خفية وإخراج واحد.

هل كانت مفيدة؟

المحلول

كيف أقوم بحساب الكمية الأمثل للبيانات لتدريباتي؟

إنه يعتمد تمامًا على الحل. هناك أيضًا القليل من الفن مع العلم. إن الطريقة الوحيدة لمعرفة ما إذا كنت في منطقة التزايد هي أن تختبر شبكتك بانتظام مقابل مجموعة من بيانات التحقق من الصحة (هذه هي البيانات التي تقوم بها ليس تدريب مع). عندما يبدأ الأداء على هذه المجموعة من البيانات في الانخفاض ، من المحتمل أنك تدربت بعيدًا جدًا - تراجع إلى التكرار الأخير.

كانت النتائج جيدة جدًا مع هذا الحجم الأخير ولكني أود العثور على المبلغ الأمثل.

"الأمثل" غير ممكن بالضرورة ؛ يعتمد ذلك أيضًا على تعريفك. ما تبحث عنه عمومًا هو درجة عالية من الثقة بأن مجموعة معينة من الأوزان ستعمل "بشكل جيد" على بيانات غير مرئية. هذه هي الفكرة وراء مجموعة التحقق من الصحة.

نصائح أخرى

يعد تنوع مجموعة البيانات أكثر أهمية من كمية العينات التي تغذيها للشبكة.

يجب عليك تخصيص مجموعة البيانات الخاصة بك لتضمين وتعزيز البيانات التي تريد أن تتعلمها الشبكة.

بعد أن قمت بصياغة مجموعة البيانات المخصصة ، يجب عليك البدء في اللعب بمقدار العينات ، لأنها تعتمد تمامًا على مشكلتك.

على سبيل المثال: إذا كنت تقوم ببناء شبكة عصبية للكشف عن قمم إشارة معينة ، فسيكون من غير المجدي تمامًا تدريب شبكتك مع عينات من الإشارات التي لا تحتوي على قمم. تكمن في أهمية تخصيص مجموعة بيانات التدريب الخاصة بك بغض النظر عن عدد العينات التي لديك.

من الناحية الفنية ، في الحالة العامة ، وافتراض أن جميع الأمثلة صحيحة ، فإن المزيد من الأمثلة أفضل دائمًا. السؤال هو حقًا ، ما هو التحسن الهامشي (المشتق الأول لجودة الإجابة)؟

يمكنك اختبار هذا عن طريق تدريبه مع 10 أمثلة ، والتحقق من الجودة (قل 95 ٪) ، ثم 20 ، وما إلى ذلك ، للحصول على جدول مثل:

10 95%
20 96%
30 96.5%
40 96.55%
50 96.56%

يمكنك بعد ذلك رؤية مكاسبك الهامشية بوضوح ، واتخاذ قرارك وفقًا لذلك.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top