Comment optimiser la fonction cachée corrélée du temps - la machine à bonbons magique

https://datascience.stackexchange.com/questions/31179

31-10-2019
|

Question

Supposons que nous avons cette machine à bonbons magique qui prend des bonbons en entrée et fournit à nouveau des bonbons comme sortie.

Pour tout moment, il choisit une fonction aléatoire qui augmente strictement jusqu'à un point tel que f (2) = 6 ici, puis il diminue strictement. Il aime être difficile, mais si vous devenez gourmand, cela vous punit comme la plupart des choses dans la vie.

f (1) = 5

f (2) = 6

f (3) = 4

f (4) = 2

f (100) = 0
Le point délicat est que cette fonction change tout le temps, mais toujours fortement corrélée avec le temps. Donc f () sera similaire entre t (1) et t (2), mais très différent entre t (1) et t (100).

Je veux écrire un programme pour maximiser mes bonbons en utilisant cette machine à bonbons magique. Je connais les principes fondamentaux de ML, mais je ne sais pas quelle approche conviendrait le mieux ici. Des idées?

Remarque: vous ne pouvez jouer qu'une seule fois à chaque minute.

Pas de solution correcte

Licencié sous: CC-BY-SA avec attribution

Non affilié à datascience.stackexchange