このf＃minimaxで最高の最初のレベルを返す方法は？

https://stackoverflow.com/questions/3114736

29-09-2019
|

質問

この質問は、f＃stactically questionよりもセマンティックアルゴリズムデータと構造の質問です。 Minimaxアルゴリズムがあります。 Minimaxアルゴリズムは、開始位置から最高の次の動きを返す必要があります。これを行うには、次のすべての動きを計算し、次に次のネクストモーブが決定された深さまで、または動きがないまで移動します。このような木を構築します：

     P  
   /  \  
 a      b  
/ \  
c d

私はツリーを処理するための転倒データ構造体を持っています：

type TreeOfPosition =
    | LeafP   of Position * int
    | BranchP of Position * TreeOfPosition list

上の例の木では、 P と a ブランチです b, c と d 葉です。以下のコードは私のMinimaxアルゴリズムです。

let evaluateTree ( tree : TreeOfPosition, player : int) =
    let rec loop minOrmax node =
        match node with
        | LeafP(position, 0) -> 
            LeafP(position, evaluateLeaf(position))
        | BranchP(position, children)  -> 
            minimax.[minOrmax](List.map (loop (1 - minOrmax)) children)
    loop player tree

このコードは私に葉を返しています。たとえば c. 。再帰呼び出しを変更したとき

| BranchP(position, children)  -> 
    LeafP(position, 
          getStaticEvalFromNode(minimax.[minOrmax](
                       List.map (loop (1 - minOrmax)) children)))

そして、この変更により、良い葉の静的値が上がります。最高の第2レベルのノードを返す必要があります。誰かが助けることができることを願っています！ペドロデュッソ

編集1

すべての答えをありがとう、彼らは私をとても助けてくれます。申し訳ありませんが、物事をあまり特定しませんでした。部分的に行こう：

1）私は葉のように一致しています LeafP(position, 0) なぜなら、ツリーを作成すると、デフォルト値が0の静的値としてリーフを設定するからです。静的値を上げて、葉を排除し、（分岐の前に）葉を（最小または最大）静的値で作るとき、私はこのようにして、元分岐葉の評価を防ぐと思いました（それは持っていなかったので0値）。

2）私の最大の問題は、2番目のレベル（プレイする必要がある次の動き）を獲得することでした。私はそれをこのように解決しました：

let evaluateTreeHOF ( tree, player : int) =
    let rec loop minOrmax node =
        match node with
        | LeafP(position, 0) -> LeafP(position, evaluateLeaf(position))
        | BranchP(position, children) -> LeafP(position,(children 
                                                         |> List.map (loop (1 - minOrmax)) 
                                                         |> minimax.[minOrmax] 
                                                         |> getStaticEvalFromNode))
    match tree with
    | BranchP(position, children) -> children |> List.map (loop (1 - player)) |> minimax.[player]

ツリー全体を渡す代わりに、私はスタートノードの子供のみを通過し、結果のリスト（現在のレベルで最高になった静的値を持つ元ブランチのリスト）を再びフィルタリングしています。このようにして、私が望んでいたノードを取得しています。

KVBは非常に面白いと思いましたが、少し複雑です。他のものは私が理解していましたが、彼らは私に静的値を返してくれました - そして私は彼らを私のために働かせることができませんでした:(

すべての答えに感謝します、それらはすべて私に多くのインスピレーションを与えました。

これが私の完全なコードです：（http://www.inf.ufrgs.br/~pmdusso/works/functional_implementation_minimax_fsharp.htm)

ペドロデュッソ

解決

私はあなたのサンプルのいくつかの側面をよく理解していません（たとえば、なぜあなたはそれらに0が入っている葉と一致するのですか？）ので、以下にいくつかの変更を加えます。まず第一に、葉や枝にあらゆる種類のデータを保存できるように、ツリータイプを少し一般化しましょう。

type Tree<'a,'b> = 
| Leaf of 'a 
| Branch of 'b * Tree<'a,'b> list

0または1を使用するのではなく、専用のプレーヤータイプも使用しましょう。

type Player = Black | White

最後に、最良の動きの評価を少し一般化して、葉の評価関数が議論として渡されるようにしましょう。

let bestMove evalPos player tree =
  // these replace your minimax function array
  let agg1,agg2,aggBy = 
    match player with
    | Black -> List.min, List.max, List.maxBy
    | White -> List.max, List.min, List.minBy

  // given a tree, this evaluates the score for that tree
  let rec score agg1 agg2 = function
  | Leaf(p) -> evalPos p
  | Branch(_,l) -> agg1 (List.map (score agg2 agg1) l)

  // now we use just need to pick the branch with the highest score
  // (or lowest, depending on the player)
  match tree with
  | Leaf(_) -> failwith "Cannot make any moves from a Leaf!"
  | Branch(_,l) -> aggBy (score agg1 agg2) l

他のヒント

相互に再帰的な機能を使用できると思います。

let maxTree t = 
  match t with
  | child -> xxx
  | subtrees s ->
      s |> Seq.map minTree |> Seq.max

and minTree t = 
  match t with
  | child -> xxx
  | subtrees s ->
      s |> Seq.map maxTree |> Seq.min

この問題の解決策は、f＃.netジャーナル記事で説明されています ゲームプログラミング：TIC-TAC-TOE （2009年12月31日）と次のパターンを使用します。

type t = Leaf | Branch of t seq

let aux k = function
  | Leaf -> []
  | Branch s -> k s

let rec maxTree t = aux (Seq.map minTree >> Seq.max) t
and minTree t = aux (Seq.map maxTree >> Seq.min) t

を参照してください再生可能なデモ.

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow