ふかうら王

ふかうら王は、深層学習系の将棋AIとして言及されることがあるソフトで、公開資料では dlshogi 互換エンジン、AlphaZero 型の将棋AI と説明されている。

概要

ふかうら王は、alpha-beta 系のやねうら王とは系統が異なり、 policy/value network を使う DL 系の流れに属する。

2024年の WCSC34 アピール文書では、

と説明されている。

そのため、コンピュータ将棋 Wiki 上では、 やねうら王系の話題と関連はあるが、探索方式は MCTS / policy-value 系である という整理が分かりやすい。

ふかうら王を理解するうえでは、次の系譜が重要である。

この意味で、NNUE + alpha-beta のNNUE系とは別の系統にある。

近年の将棋AIは大きく

に分けて語られることが多い。

ふかうら王は後者の文脈で参照しやすいソフトであり、 dlshogi互換 という説明が付くことで、学習や推論方式の位置づけも理解しやすい。

DL 系エンジンでは、概念的には次のような流れで指し手を決める。

policy, value = model.infer(position)
root = mcts(position, policy, value, simulations=800)
best_move = root.most_visited_move()

これは説明用の単純化であり、実際には

などが重要になる。