당신이 가지고 있다면 선험적으로 환경에 대한 지식이 있지만 환경에서 위치를 감지하는 불완전한 능력(아마도 불완전한 행동)이라면 설명하는 내용은 부분적으로 관찰 가능한 마르코프 결정 프로세스(POMDP)일 수 있습니다. 4버튼 센서가 그 아이디어에 잘 들어맞습니다.
환경에 대한 사전 지식조차 없다면 탐색 또는 기계 학습 요소로 POMDP 개념을 강화해야 합니다.
POMDP는 "보상"이 있는 시나리오에 맞춰져 있으며 POMDP는 꽤 잘 이해되어 있지만 효율적인 솔루션은 여전히 연구 주제입니다.ML/POMDP 하이브리드도 마찬가지입니다.