ふかうら王

ふかうら王は、深層学習系の将棋AIとして言及されることがあるソフトで、 公開資料では dlshogi 互換エンジンAlphaZero 型の将棋AI と説明されている。

概要

ふかうら王は、alpha-beta 系のやねうら王とは系統が異なり、 policy/value network を使う DL 系の流れに属する。

2024年の WCSC34 アピール文書では、

  • 探索部には DL 系の将棋AIであるふかうら王を利用
  • dlshogi 互換エンジン
  • AlphaZero 型の将棋AI

と説明されている。

そのため、コンピュータ将棋 Wiki 上では、 やねうら王系の話題と関連はあるが、探索方式は MCTS / policy-value 系である という整理が分かりやすい。

系統

ふかうら王を理解するうえでは、次の系譜が重要である。

この意味で、NNUE + alpha-beta のNNUE系とは別の系統にある。

将棋AI史での位置づけ

近年の将棋AIは大きく

  • NNUE 系
  • DL 系

に分けて語られることが多い。

ふかうら王は後者の文脈で参照しやすいソフトであり、 dlshogi互換 という説明が付くことで、学習や推論方式の位置づけも理解しやすい。

実装上の観点

DL 系エンジンでは、概念的には次のような流れで指し手を決める。

policy, value = model.infer(position)
root = mcts(position, policy, value, simulations=800)
best_move = root.most_visited_move()

これは説明用の単純化であり、実際には

  • GPU 利用
  • バッチ推論
  • 探索木の再利用
  • 学習データの蓄積

などが重要になる。

関連項目

参考にしたホームページ