Question

Supposons que nous avons cette machine à bonbons magique qui prend des bonbons en entrée et fournit à nouveau des bonbons comme sortie.

  1. Pour tout moment, il choisit une fonction aléatoire qui augmente strictement jusqu'à un point tel que f (2) = 6 ici, puis il diminue strictement. Il aime être difficile, mais si vous devenez gourmand, cela vous punit comme la plupart des choses dans la vie.

    f (1) = 5

    f (2) = 6

    f (3) = 4

    f (4) = 2

    f (100) = 0

  2. Le point délicat est que cette fonction change tout le temps, mais toujours fortement corrélée avec le temps. Donc f () sera similaire entre t (1) et t (2), mais très différent entre t (1) et t (100).

Je veux écrire un programme pour maximiser mes bonbons en utilisant cette machine à bonbons magique. Je connais les principes fondamentaux de ML, mais je ne sais pas quelle approche conviendrait le mieux ici. Des idées?

Remarque: vous ne pouvez jouer qu'une seule fois à chaque minute.

Pas de solution correcte

Licencié sous: CC-BY-SA avec attribution
scroll top