1ツイートくらいで解る、コンピュータ将棋の用語集です。

業務連絡

  • ritomath氏の用語集をリファクタした記事を追加(著者の許可は得ています)(カッパ)
  • 長文になりがち(きふわらべ)

2

256手

コンピュータが持将棋の提案を上手く出来ないために、対局が無限に長引くことを防ぐために作られたルール。256手目まで対局が進んだら引き分けとする。256手目に詰まされたら後手勝ち。257手目に詰まされたら引き分け....にならなかった(ヒント:電王トーナメント、257手)。

3

320手

第29回世界コンピュータ将棋選手権から採用されている手数の上限。第28回で長手数が多かったことから伸ばした。代わりに第28回で10秒だったフィッシャークロック・ルールでの加算時間は、第29回では 5秒に減った。これは会場の開場時間の都合から逆算して 1局が1時間ぐらいで終わってほしいから。

5

512手

世界将棋AI電竜戦で採用されている手数の上限。これは DeepMind社が将棋をディープラーニングして勝手に覚えるという AlphaZero の機械学習方法で、512手に達したら引き分けとするというルールを採用していたことから、 AobaZero がそのルールの通り追試し、さらに電竜戦の理事長のカツ丼が AobaZero を真似た。
もちろん大会の閉会時間も押すことから、電竜戦TSEC2のB級では フィッシャークロック・ルールで持ち時間1分、加算時間を 2秒にしたり、 1秒にするといった超早指しにすることもあった。

A

AlphaGo

(アルファゴ) [囲碁・エンジン名]
Google傘下のDeepMind社が"Mastering the game of Go with deep neural networks and tree search"という論文で発表した、ハンデキャップなしで囲碁のプロ棋士を破った初めての囲碁AI。 ディープラーニングとMCTS(モンテカルロ木探索)を組み合わせることで以前の手法では到達できなかった強さを手に入れた。

AlphaGo Zero

(アルファゴゼロ)[囲碁・エンジン名]
AlphaGoの改良版。 AlphaGoは人間の棋譜・知識を利用していたが、AlphaGoZeroではそれらに頼らなくなった。 他は、1:終局までプレイアウトするかどうか、2:ニューラルネットのサイズ、などが違う。

AlphaZero

(アルファゼロ)[囲碁・チェス・将棋・エンジン名]
AlphaGoZeroを微修正して囲碁だけでなく将棋やチェスもプレイできるようにしたのがAlphaZero。 基本的な仕組みはAlphaGoZeroとあまり変わらない。 AlphaGo・AlphaGoZero・AlphaZeroをベースにした将棋ソフトも多い。 👉 DL系

C

CSA

(シーエスエー)[団体名]
Computer Shogi Association。コンピュータ将棋協会。世界コンピュータ将棋選手権を主催してるのはここ。

(シーエスエー)[IT関連]
棋譜ファイルの形式

D

Depth

(デプス)[探索部]
木探索の深さ。コンピュータ将棋では何手か先の局面を評価し差し手を決定するが,その読んだ手数に当たる。

DL系

(ディーエルけい) [ソフトの分類・系統]
AlphaGoZero、AlphaZeroなどがベースのソフトの総称。(dlshogiやAobaZeroなど) NNUE系よりも序盤が得意だと言われている。

E

elmo

(えるも)[将棋エンジン名]
👉 この記事では「え」の段。

F

floodgate

(フラッドゲート)[場所]
コンピュータ将棋ソフト同士が対局してる場所(リンク)。持ち時間の長い対局で強いソフトの棋譜が得られる。時々40コア80スレの化物みたいな奴が出てくる。

G

GUI

(ジーユーアイ)[IT関連]
Graphical User Interface(グラフィカルユーザーインターフェース)視覚的に人間に分かりやすくするためのもの。元来将棋ソフトは文字列のやり取りだけで盤面や指し手を表している(CUI)のだが、それでは人間が見づらいため、将棋神やねうら王、将棋所か、将棋GUIなどのGUIツールがよく用いられる。

K

KIF

(キフ)[IT関連]
柿木さんが開発している柿木将棋(コンピュータ将棋ソフト)の棋譜を保存するファイル形式。柿木さんは将棋連盟の顧問もしており、将棋連盟や、その他インターネット上で提供しているサービスでKIF形式が広く使われている。1990年頃からある形式で日本国内向けの仕様をしており、2021年現在では海外のプログラマーには扱いにくいことを受け、国際的な普及に向け仕様変更する作業を柿木さん1人で行っている。
人手が足りていないことの1つ。

KPPT

(ケーピーピーティー)[評価関数部]
玉と玉以外の駒二つからなる3駒の並び(例:初期局面なら59玉、28飛車、27歩など)に予め点数をつけておき、 それらの和で盤面の評価値を決定する評価方法。詳しくはリンク参照。 WCSC28までは強豪ソフトの主流であったが、NNUEの登場によりその優位性を試されている。

M

Mate

(メート)[探索部]
Mate xでx手以内に詰むという意味。Mate 25が25手詰めではないことに注意。

multiPV

(マルチ・ピーブイ) [探索部]
読んでいる手の種類。 multiPVはソフトを使って戦型などを研究するときによく出てくる用語。multiPVの後ろにある数と同じだけの候補手を出してくれる。

  • 例文「multiPV 3で読ませると76歩、26歩、78金が候補になります」→「ソフトが良いと考えている上位3手は76歩、26歩、78金です」

N

NNUE

(エヌエヌユーイー,ヌエ)[評価関数部]
通称「鵺」。ニューラルネットワーク型の評価関数。オリジナル版はKP -> 512chのニューロン -> 32chのニューロンx2 -> 評価値という形式をとっている。ニューラルネットの非線形性と、差分計算による高速な計算が特徴。KPPTよりも強い評価関数と考えられている。 コンピュータチェスでもかなり強いらしく、2020年8月にstockfishに取り込まれた際はstockfishのレートを大きく上げた。 現在(2022/6/18)は、やねうら王とそのチルドレン以外の実装例も少数ながら存在する。

NNUE系

(ヌエけい, エヌエヌユーイーけい) [ソフトの分類・系統]
"NNUE + αβベースの探索部"という構成のソフトの総称。(やねうら王、水匠、elmoなど) DL系よりも中終盤が得意だと言われている。

Node数

(ノードすう)[探索部]
ソフトが読む盤面の数。Node数が大きければ大きいほど棋力が高くなる。例えばやねうら王とQhapaq_wcsc28の評価関数を用いた場合、ノード数とレーティングの間には次のような関係式があるという調査がある。(ソフトレート)=295 log(ノード数)+1320。ここでlogは自然対数である。

NPO法人AI電竜戦プロジェクト

👉 特定非営利活動法人AI電竜戦プロジェクト

O

OS

(オーエス)[IT関連]
オペレーティングシステム。linux,windows,mac,android,iosなど。OS毎に得意なことが違うため、開発者/ユーザの好みがソフトの特徴にも影響をもたらすことがある。よく用いられるのは速度が出やすいlinuxとユーザが多いwindows

P

pv

(ピーブイ)[探索部]
読んでいる手筋。 読み筋のことをちょくちょくPVと呼ぶことがある。

  • 例文「pvは83飛車82香です」→「ソフトは今は▲83飛打△82香打の筋を考えて居ます」

Ponder

(ポンダー)[探索部]
相手の手番中に読んでる手筋。将棋ソフト用語でのponderは、相手の手番中に相手の指し手を予想して読むことを意味する。ponderは当たれば相手の消費時間分だけ長く手を考えられる一方、外れればゼロから読み直しになる。それ故にponderが当たるか否かは勝負を決める上で重要な要素となる。

S

SDT

(エス・ディー・ティー)[イベント名]
Shogi Denou Tournament。将棋電王トーナメント。ドワンゴ主催、コンピュータのスペックは固定。トーナメント方式は決勝リーグだけ。2017年の第五回を持って終了。

shogi-server

(しょうぎサーバー)[サーバー・プログラム名]
オープンソースのコンピューター将棋対局サーバー・プログラム。Ruby言語で書かれている。超絶技巧とも言えるプログラミングのGPS将棋のメンバーの森脇さんが1人でメンテナンスしている。
floodgateおよび、電王トーナメント(現在は終了)、電竜戦のサーバーでもある。WCSCもshogi-serverに移行する可能性があり、コンピューター将棋イベントは 森脇さんにおんぶに抱っこ状態に向かっている。
今のところ困っている人はいないが、先手と後手で異なる対局時間を設定できないため千日手指し直しが行えないところがあり将来的な企画の拡大に困る可能性がある。
人手が足りてない(ことになりそうな)ことの1つ。

stockfish

(ストックフィッシュ)[チェス・エンジン名]
選手権での俗称は魚(さかな)。 チェスの超強豪ソフト。オープンソースで開発されており、非常に細かいパラメタ調整を組織だって行っている。コンピュータ将棋の探索部はstockfishの影響を強く受けている。

U

USI

(ユーエスアイ)
USI(Universal Shogi Interface)プロトコル。

W

WCSC

(ダブリュー・シー・エス・シー)[イベント名]
World Computer Shogi Championship。
👉 世界コンピュータ将棋選手権

アルファベータ探索

[探索部]
アルファは自分、ベータは相手。アルファとベータの 2人 で交互に手番が回ってくるゲームで、かつ、自分が得をした分はそのまま相手の損であるという 零和(ゼロサム) ゲームのとき、役に立つ探索。
将棋が 二人零和有限確定完全情報ゲーム だと言われているのがここで生きてくる。
将棋の読みは 木のように枝葉が広がっていくが、この枝を読まずに省いても結果が変わらないところが事前に分かる ベータカット が使えるのが強み。
👉 きふわらべのアルファベータ探索まとめ

枝刈り

[探索部]
76歩、34歩、78銀のような精査する必要のない局面を読み飛ばすことで探索を効率化する手法の総称。実際の将棋ソフトはアルファベータ法やmin-max法のような全探索に近いものから(参考)、ヒューリスティックな枝刈りを組み合わせている。

elmo絞り

(エルモしぼり)[学習部]
雑巾絞りの進化形。評価値と勝ち負けの合議で手の良し悪しを求め、それを教え込む雑巾絞りの発展版。WCSC27で初めて公開されelmoの優勝の原動力となった。

学習

評価関数ファイルに学習をさせること。これにより同じ評価関数の方式でも、個性や強さの違いが生まれる。

学習部

評価関数ファイルに学習をさせる機能。パラメータや教師局面や元となる評価関数ファイルを入力して大量に自動的に学習させ、新たな評価関数ファイルを出力する。

拡張子

(かくちょうし;Extension)[IT関連]
Windowsでファイル名の後ろに付いて、ファイルの種類を表している .txt とか、 .kif の部分。
2021年現在、コンピュータが民間に普及して50年ぐらい経っているのに、初見でなんだか分からないユーザーに優しくないデザインのものの1つ。誤って .txt.txt にしてしまったりする。
多くの場合ファイル名は変えれるので、例えば happy_new_year.jpg というファイル名を見ても、それが JPEG画像とは限らない。
強いて言えば、性善説とマナーの上に立って、そのファイルが何かを表している。

機械学習

(きかいがくしゅう)[学習部]
TODO

教師局面

(きょうしきょくめん)[学習部]
TODO

合議

[技術] 複数のソフトを使って1つの指し手を決める方式。 ソフトはすべて同じ種類でもいいが、違う種類のほうが良いと言われている。 DL系の序盤の強さとNNUE系の中終盤の強さをいいとこどりするために合議を用いるソフトも存在する。

コンピュータ将棋 レーティング

[場所]
uuunuuun氏が管理しているサイト、または、本プロジェクトが運営しているサイト。 将棋ソフトの自己対局データを集めることで、ソフトのレートを測定している。floodgateに較べると対局の持ち時間が短いが、使用ソフトの素性が明確になっているため、データとして解析がしやすいなどの特徴がある。

サチる

(saturationる)[学習部]
用法: 棋力がサチる,学習曲線がサチる,表現力がサチる
機械学習をやってるときに、コンピューターの物覚えに当たる評価関数部の調整が限界に来たとか、まだまだ計算できるのに、もうこれ以上強いデータにならないぐらいの意味。
一番良く調整されている状態。もっと強くしたい上位のチームからするとサチっても嬉しくない。

自己対戦

(じこたいせん)[学習部]
Self play. コンピュータ将棋ソフトが、自分同士で対局すること。
何でそんなことをするのかというと、自分が強くなると、自分の対局相手は自分なので、対局相手も強くなっているという理屈。
強化学習の話題の中で出てくる。

ストックフィッシュ

👉 Stockfish

世界コンピュータ将棋選手権

(せかいコンピュータしょうぎせんしゅけん)[イベント名]
略称 WCSC。
PCのスペック制限なし。総力戦になる。
1985年頃、小谷善行先生のところに訪れた2人のイギリス人が持ってきた将棋マシーン(8bit)と、森田和郎さんの森田将棋(16bit)の対局を行ったところ森田将棋が負けたことを始まりとして、結果はともかく ちゃんと集まって会にして 公式な記録を取って発表するために設立されたコンピュータ将棋の大会。 ポリシーにもある通り、マシン制限無し、交流する を強く指向しているところが他のイベントと異なる大きな2点。

世界将棋AI電竜戦

(せかいしょうぎ・エー・アイ・でんりゅうせん)[イベント名]
2013年~2017年の5年間は 春にWCSC、秋にSDT と、年2回のサイクルでコンピュータ将棋の大会があったが、2017年にSDTが終了したことを受けて、カツ丼が2021年から設立したコンピュータ将棋の大会。
最強のコンピュータ将棋ソフトを決める大会であり、平手初期局面で行われる。
誰も(公式サイトも)正式名称を覚えておらず電竜戦と呼ばれる。

世界将棋AI電竜戦TSEC

(せかいしょうぎ・エー・アイ・でんりゅうせん・ティー・エス・イー・シー)[イベント名]
世界将棋AI電竜戦の特別企画。平手ではなく指定局面戦。予選で2ソフトを選出し、1対1のファイナルを行う。
検討に使いやすいコンピュータ将棋ソフトを決める大会であり、指定局面から行われ、オールラウンダーの将棋ソフトを決める。
寝ている間にも大会が進む夜通しの長い戦いが他のイベントと異なる特徴。
誰も(公式サイトも)正式名称を覚えておらず電竜戦TSECと呼ばれる。

説得

(せっとく)[スラング]
対局しているソフトの意見が割れた時に使われる用語。将棋ソフトは対局相手に比べ自分を有利に評価することが多いため、ソフト同士による説得合戦はよく起こる。こういうときに将棋の強い開発者/観戦者が居ると重宝される

全幅探索

(ぜんぷくたんさく)[探索部]
全ての候補手を調べる探索手法。中終盤の将棋の合法手は100手前後あるため、全幅探索をすると4手先を読むだけでも1億局面程度読まなければならない。全幅探索は極めて効率が悪いため、将棋ソフトでは基本的に用いられない。

雑巾絞り

(ぞうきんしぼり)[学習部]
深い読みで与えられる評価値や指し手に対して、浅い読みの評価値を一致させるようにすることで、評価関数を学習する手法。凄く雑に言えば読みが深くて強いソフトで読みが浅いソフトを教育する超高速指導対局

多腕バンディット問題

(たわんバンディットもんだい)[学習部][強化学習]
1本腕のバンディットとは、スロットマシーンのこと。1本のアームを引く(スロットを回す棒を動かす)とお金を持っていかれることから。
多腕とは、スロットマシーンが複数台あること。
良く出るスロットマシーンと、お金を吸い取るばかりのスロットマシーンがあるとして、プレイヤーはお金を増やしたい。

まず、良く出るスロットマシーンがどれかを探したい。これを 探索(Exploration) と呼ぶ。 探索(Search)ではないので注意されたい。
いつまでも Exploration していても お金吸い取りマシーンの相手ばかりしているとお金は増えないので、よく増えるマシーンで沢山プレイしたい。これを 知識の活用(Exploitation) と呼ぶ。
いつまでも Exploitation していると気持ちは満足かもしれないが、もしかすると もっと お金出るマシーンがどこかにあるかも知れない。

では、どれぐらい Exploration して、どれぐらい Exploitation するか。また どんなタイミングで切り替えるのが一番儲かるのか、知りたい。
2016年時点では、以下の3つの異なるケースのどれかに当てはまるとして 分けて考えられ、それぞれ研究されたようだ。

  • 割引 - 同じスロットマシーンでずっと Exploration していると、報酬はどんどん減っていく
  • 確率的 - 同じスロットマシーンでずっと Exploration していても、報酬は減らない
  • 敵対的 - こっちの動きを予想して報酬が減っていく

もっと正確な説明は👉 📖 Vol.31.No.5(2016/9)多腕バンディット問題

探索部

膨大な局面変化の可能性がある中から、候補手を探す機能。主に評価値を頼りに探す。いかに効率よく手筋を取捨選択し、最善手にたどり着けるかが鍵となる。

チルドレン

ライブラリを使って参加したソフト達。ooチルドレンなどと呼ばれる(ooにはよくボナンザ、Apery、やねうら王、技巧などが入る)。

追加学習

(ついかがくしゅう)[学習部]
TODO

電竜戦

👉 世界将棋AI電竜戦

動物園

(どうぶつえん)[スラング]
2015年に Apery がオープンソース化した翌年、WCSC26で Apery ライブラリを使ったソフトに動物の名前が多かったことから、Apery チルドレンのこと、またはAperyは関係なく単に動物のような名前の将棋エンジンのこと。
例: Apery(→猿)、大合神クジラちゃん、たぬきのもり、Qhapaq(→カッパ)、名人コブラ、たこっと、うさぴょん2
👉 チルドレン

特定非営利活動法人AI電竜戦プロジェクト

(とくていひえいりかつどうほうじんエーアイでんりゅうせんプロジェクト)[団体名]
特定非営利活動法人をアルファベットで書くとNPO法人。NPO法人はなんか健康とか世界平和とかでよく見かけるやつ。AI電竜戦プロジェクトは電竜戦を主催しているとこ。AIの普及を目的に掲げている。もっと身近に言えば、2017年に電王トーナメントが終了したので、2020年にカツ丼 他、選手権の開発者が集まってボランティアで第1回電竜戦を開催、大会を2年は行える分の寄付を集め、2021年にカツ丼がNPO法人を設立した。
3年目の大会をやる分の寄付は募り中。

土下座

(どげざ)[スラング]
評価値が急転直下で変化するような展開を指す。会場は盛り上がることが大いが開発者はたまったものではない。

ナイアガラ

[スラング]
評価値グラフが一転してナイアガラの滝のように急変動する現象。ガラ。多くは終盤で勝勢の評価値からの逆転負けを指す。

ヌエ

👉 NNUE

反省

(はんせい)[スラング]
ソフトが自分有利の局面評価を一変し、評価値を悪く捉え直す様。

評価関数

局面を評価して評価値を計算する機能。評価関数と言う場合、エンジンかバイナリデータ、つまりプログラムか生成データのいずれか、或いは両方を指す。多くはバイナリデータファイルである評価関数ファイルを指す。

評価値:現在何方がどれぐらい有利かを示した指標

現在何方がどれぐらい有利かを示した指標。評価値がプラスであれば手番側が有利、マイナスであれば手番側が不利であるという判定方法が一般的。0を互角とし歩1枚につき100点程度の点数をつけることが多い。点数については±200以内で互角、200~600ぐらいで有利、600を超えたあたりから優勢で、1200を超えたあたりから勝勢と言われるが、ソフト同士の対局だと400ぐらいからほぼひっくり返らない。 細かくは、評価値は指し手に対して付けられるのではなく、その局面そのものに対して評価値が付けられる。

フラッドゲート

👉 floodgate

不利飛車

(ふりびしゃ)[スラング]
コンピュータ将棋であっても振り飛車の勝率は悪い。大抵のソフトは飛車を振ることで勝率が4割前後まで落ちる。

ボナメソ

👉 ボナンザ・メソッド

ボナンザ・メソッド

[学習部]
通称 ボナメソ。Bonanzaが使った学習方法。プロの棋譜を再現できる評価関数が良い評価関数であるという仮定に基づき評価値を調整していく。ボナメソが生まれた頃は評価関数は人間が手調整するのが当たり前だったため、ボナメソは革命的な存在であった。

ライブラリ

第29回世界コンピューター将棋選手権を最後に廃止された制度。
かつて CSAに登録されていて、中身を使って改造していいよって言ってるソフト達。ライブラリを改造したソフトで大会に出られるかはライブラリと大会の規約に依存するため注意が必要である。

レート

強さのこと。将棋界ではイロレーティングがよく用いられている。 将棋倶楽部(人間同士の対局場)、floodgate(ソフト同士の対局場)、レーティングサイトで値が異なる。研究結果によると、将棋倶楽部>レーティングサイト>floodgateの順でレートが高く出やすいらしい。 例えばレートが対戦相手より30高いと54%程度の期待勝率。100高いと64%程度の期待勝率。300高いと85%程度の期待勝率。700高いと99%程度の期待勝率。詳しくはwikipediaを参照。

ソフトレーティングと将棋倶楽部24の対応関係

将棋ソフトのレーティングと将棋倶楽部24との比較はすでに調査がなされている。対応関係は非線形で将棋倶楽部24のレーティング300-2900の間では次の概算がなされている。(24レート)=-0.0003(ソフトレート)^2 +2.61(ソフトレート)-1948