Comment optimiser la fonction cachée corrélée du temps - la machine à bonbons magique
-
31-10-2019 - |
Question
Supposons que nous avons cette machine à bonbons magique qui prend des bonbons en entrée et fournit à nouveau des bonbons comme sortie.
Pour tout moment, il choisit une fonction aléatoire qui augmente strictement jusqu'à un point tel que f (2) = 6 ici, puis il diminue strictement. Il aime être difficile, mais si vous devenez gourmand, cela vous punit comme la plupart des choses dans la vie.
f (1) = 5
f (2) = 6
f (3) = 4
f (4) = 2
f (100) = 0
Le point délicat est que cette fonction change tout le temps, mais toujours fortement corrélée avec le temps. Donc f () sera similaire entre t (1) et t (2), mais très différent entre t (1) et t (100).
Je veux écrire un programme pour maximiser mes bonbons en utilisant cette machine à bonbons magique. Je connais les principes fondamentaux de ML, mais je ne sais pas quelle approche conviendrait le mieux ici. Des idées?
Remarque: vous ne pouvez jouer qu'une seule fois à chaque minute.
Pas de solution correcte