سؤال

أحاول إنشاء بسيط شرائحعلى أساس مخطط.لقد أكملت الوظائف الأساسية لحساب منفصل احتمالي الخطط التي سوف تصل إلى الهدف, ولكن الآن أنا في محاولة لتحديد كيفية تجميع هذه الخطط على أساس الإجراءات الأولية ، لتحديد ما "الشاملة" أفضل عمل في الزمن t0.

النظر في المثال التالي.الأداة ، يحدها بين 0 و 1 ، يمثل مدى الخطة يحقق الهدف.را ، كما يحدها بين 0 و 1 ، يمثل اليقين-عامل ، أو احتمال أن تنفيذ الخطة سيؤدي في الأداة المساعدة.

Plan1: CF=0.01, Utility=0.7
Plan2: CF=0.002, Utility=0.9
Plan3: CF=0.03, Utility=0.03

إذا كان كل ثلاث خطط وهي حصرية بشكل متبادل ، مع بدء العمل A1, كيف يجب أن الكلي لهم لتحديد عموما "اللياقة البدنية" من أجل استخدام العمل A1?فكرتي الأولى هي مبلغ اليقين-عوامل متعددة أن متوسط المرافق.هل يبدو هذا صحيح ؟

لذا النتيجة الحالية تبدو مثل:

fitness(A1) = (0.01 + 0.002 + 0.03) * (0.7 + 0.9 + 0.03)/3. = 0.02282

أو علي حساب الفرد المحتمل المرافق و المتوسط ؟

fitness(A1) = (0.01*0.7 + 0.002*0.9 + 0.03*0.03)/3. = 0.00323

هل هناك مزيد من الناحية النظرية الطريقة ؟

هل كانت مفيدة؟

المحلول

إذا كنت اتخاذ إجراءات A1, ثم عليك أن تقرر أي من 3 خطط لمتابعة الذي لا يجتمعان.عند هذه النقطة يمكن أن نحسب أن المنفعة المتوقعة من الخطة 1

E[plan1] = Prob[plan1 succeeds]*utility-for-success 
           + Prob[plan1 fails]*utility-of-failure
         = .01*.7 + .99*0 //I assume 0
         = .007

وبالمثل الأخرى 2 الخطط.ولكن بما أنك يمكن أن تختار واحدة فقط خطة حقيقية المنفعة المتوقعة (والتي أعتقد هو ما تعنيه "اللياقة البدنية") من اتخاذ إجراءات A1

max(E[plan1],E[plan2],E[plan3]) = fitness(A1)

نصائح أخرى

أعتقد أن اللياقة البدنية وظيفة كنت تتحدث عن أن تنظر أيضا في جميع الخطط التي لا A1 أول العمل.ثم يمكن أن تكون جيدة حقا في هذه الحالة القيام A1 هو فكرة سيئة أو أنها قد تكون فظيعة في هذه الحالة القيام A1 يبدو خطوة جيدة.

النظر في أفكارك ، والثاني المنطقي أكثر بكثير مني.فإنه يحسب المنفعة المتوقعة من اختيار خطة موحد عشوائيا من جميع الخطط التي تبدأ مع A1.هذا على افتراض أن خطة إما يحقق تعطى فائدة أو فشل تماما.على سبيل المثال الخطة الأولى يحصل على فائدة=0.01 مع احتمال 0.7 ويحصل على فائدة=0 مع احتمال 0.3.هذا يبدو معقولا الافتراض ، انها كل ما يمكن القيام به إلا إذا كان لديك المزيد من البيانات للعمل مع.

حتى هنا اقتراحي:اسمحوا A1 تكون جميع الخطط بدءا من A1 و ~A1 تكون جميع الخطط لا-بدءا من A1.ثم

F(A1) = fitness(A1) / fitness(~A1)

حيث اللياقة البدنية كما يعرف ذلك في المثال الثاني.

هذا يجب أن تعطيك نسبة المنفعة المتوقعة لخطط بدءا A1 ضد تلك التي لا.إذا كان أكبر من واحد ، A1 يشبه عمل جيد.

إذا كنت مهتما في احتمالي التخطيط يجب أن يكون لديك نظرة على POMDP نموذج و خوارزميات مثل قيمة التكرار.

تحرير:

في الواقع يجب أن يكون أشار إلى ماركوف عملية اتخاذ القرار (بدون بو).أنا آسف.

ماذا عليك أن تفعل ربما لمشكلتك هو تعظيم المنفعة المتوقعة.استدعاء اللياقة البدنية هذا.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top