Se hai a priori Conoscenza dell'ambiente, ma la capacità imperfetta di percepire la tua posizione nell'ambiente (e probabilmente azioni imperfette), quindi ciò che stai descrivendo può essere un processo decisionale di Markov parzialmente osservabile (POMDP.) Il tuo sensore a quattro tipi si adatta perfettamente a quell'idea.
Se non hai nemmeno una conoscenza preliminare dell'ambiente, allora devi aumentare la nozione di POMDP con elementi di esplorazione o apprendimento automatico.
Si noti che i POMDP sono orientati verso scenari con "premi" e che mentre i POMDP sono abbastanza ben compresi, le soluzioni efficienti sono ancora un argomento di ricerca. Come sono ibridi ML/POMDP.