TOP
> 記事閲覧
AobaZeroの学習棋譜を指定局面から作るように
| 件名 | : Re: AobaZeroの学習棋譜を指定局面から作るように |
| 投稿日 | : 2025/12/14(Sun) 15:37 |
| 投稿者 | : 山下 |
| 参照先 | : |
下の例は26523棋譜の中から8698番目を選び、手数は26手目から開始、という意味です。
開始手数も0手から60手までランダムに選びます。
30手が一番選ばれやすく10000棋譜で663棋譜ほど、0手目(初期局面)は10000棋譜で1棋譜ほど、でほとんど選ばれません。
探索中だと、今までは最初の30手までは訪問回数の分布から乱数で選んでいましたが、
探索開始手数から+10手まで、を分布で選ぶようにしてます。この例では36手目までです。
Rootでは常にディリクレノイズが足される、は一緒です。
また探索開始から+10手までは投了しません。全体の10%の棋譜では投了せずに投了の閾値を自動調節、は以前と同じです。
開始局面集のファイルはこちらです。
https://github.com/kobanium/aobazero/blob/release/aoba26523.sfen
'no000073340003 12/13/25
'w 4576 (crc64:69738bca5f8a7b30), autousi 3.11, usi-engine 45
'-q -r 0.0 -p 12800 -kldgain 0.0000004 -kldinterval 400 -n -m 10 -w ./weight-save/w000000004576.txt -e 0, average_winrate 0.616, sfen 8698/26523, moves 26
PI
+
+2878HI
-8232HI
+7776FU
-3334FU
+5948OU
-1314FU
+7968GI
-5162OU
+3928GI
-7182GI
+6766FU
-6272OU
+9796FU
-4151KI
+6958KI
-3142GI
+8786FU
-5162KI
+8685FU
-4344FU
+9695FU
-3435FU
+6867GI
-4233GI
+7877HI
-1415FU
+7787HI,'v=0.749,r=0.533,11200,7787HI,7767p,6665FU,2455i,7675FU,249j,4838OU,157c,4839OU,137e,6756GI,127d,8897KA,53f,7778HI,37c,5756FU,31Z,2839GI,30W,2726FU,29d,7779HI,20a,4938KI,19W,1918KY,18M,9996KY,15N,8879KA,13V,5868KI,10N,7797HI,8T,9998KY,5Q,8584FU,4T,4859OU,4Q,9594FU
開始手数も0手から60手までランダムに選びます。
30手が一番選ばれやすく10000棋譜で663棋譜ほど、0手目(初期局面)は10000棋譜で1棋譜ほど、でほとんど選ばれません。
探索中だと、今までは最初の30手までは訪問回数の分布から乱数で選んでいましたが、
探索開始手数から+10手まで、を分布で選ぶようにしてます。この例では36手目までです。
Rootでは常にディリクレノイズが足される、は一緒です。
また探索開始から+10手までは投了しません。全体の10%の棋譜では投了せずに投了の閾値を自動調節、は以前と同じです。
開始局面集のファイルはこちらです。
https://github.com/kobanium/aobazero/blob/release/aoba26523.sfen
'no000073340003 12/13/25
'w 4576 (crc64:69738bca5f8a7b30), autousi 3.11, usi-engine 45
'-q -r 0.0 -p 12800 -kldgain 0.0000004 -kldinterval 400 -n -m 10 -w ./weight-save/w000000004576.txt -e 0, average_winrate 0.616, sfen 8698/26523, moves 26
PI
+
+2878HI
-8232HI
+7776FU
-3334FU
+5948OU
-1314FU
+7968GI
-5162OU
+3928GI
-7182GI
+6766FU
-6272OU
+9796FU
-4151KI
+6958KI
-3142GI
+8786FU
-5162KI
+8685FU
-4344FU
+9695FU
-3435FU
+6867GI
-4233GI
+7877HI
-1415FU
+7787HI,'v=0.749,r=0.533,11200,7787HI,7767p,6665FU,2455i,7675FU,249j,4838OU,157c,4839OU,137e,6756GI,127d,8897KA,53f,7778HI,37c,5756FU,31Z,2839GI,30W,2726FU,29d,7779HI,20a,4938KI,19W,1918KY,18M,9996KY,15N,8879KA,13V,5868KI,10N,7797HI,8T,9998KY,5Q,8584FU,4T,4859OU,4Q,9594FU
| 件名 | : Re: AobaZeroの学習棋譜を指定局面から作るように |
| 投稿日 | : 2025/12/14(Sun) 15:35 |
| 投稿者 | : 山下 |
| 参照先 | : |
学習開始局面は以下のように選んでます。
プロの棋譜 17201棋譜 2025年までの順位戦、タイトル戦、女流タイトル戦から
floodgate 36010棋譜 2024年、2025年のR3900以上同士から
--------------------
合計 53211棋譜
23682棋譜 30手目が同一を削除。半分近くがほぼ同一
--------------------
合計 29529棋譜
この30手目に似た局面を学習棋譜から探します。
AobaZeroの 6001万~7252万棋譜までの1252万棋譜、
Aoba振り飛車の1501万~2192万棋譜までの 692万棋譜、合計1944万棋譜
王、飛車の位置が一致してれば、その中で駒の配置が一番似てる形を。
一致する棋譜がない場合は、単純に駒配置が一番似てる棋譜を選んでいます。
似た棋譜の30手目が同一 2854棋譜
元の棋譜が50手以下 152棋譜
-------------------------------
を削除して 合計 26523棋譜 (最終的な棋譜数)
このうち
完全に配置が一致 7245棋譜
王と飛車が一致なし 959棋譜
戦型は
相居飛車 16689棋譜 (63%)
先手振り飛車 4864棋譜
後手振り飛車 6048棋譜
相振り 1078棋譜
先手居飛穴 352棋譜
先手振り穴 149棋譜
後手居飛穴 249棋譜
後手振り穴 148棋譜
相穴 10棋譜
振り飛車が37%と少し多いので、乱数で選ばれにくして、実際には振り飛車は28%選ばれます。
プロの棋譜 17201棋譜 2025年までの順位戦、タイトル戦、女流タイトル戦から
floodgate 36010棋譜 2024年、2025年のR3900以上同士から
--------------------
合計 53211棋譜
23682棋譜 30手目が同一を削除。半分近くがほぼ同一
--------------------
合計 29529棋譜
この30手目に似た局面を学習棋譜から探します。
AobaZeroの 6001万~7252万棋譜までの1252万棋譜、
Aoba振り飛車の1501万~2192万棋譜までの 692万棋譜、合計1944万棋譜
王、飛車の位置が一致してれば、その中で駒の配置が一番似てる形を。
一致する棋譜がない場合は、単純に駒配置が一番似てる棋譜を選んでいます。
似た棋譜の30手目が同一 2854棋譜
元の棋譜が50手以下 152棋譜
-------------------------------
を削除して 合計 26523棋譜 (最終的な棋譜数)
このうち
完全に配置が一致 7245棋譜
王と飛車が一致なし 959棋譜
戦型は
相居飛車 16689棋譜 (63%)
先手振り飛車 4864棋譜
後手振り飛車 6048棋譜
相振り 1078棋譜
先手居飛穴 352棋譜
先手振り穴 149棋譜
後手居飛穴 249棋譜
後手振り穴 148棋譜
相穴 10棋譜
振り飛車が37%と少し多いので、乱数で選ばれにくして、実際には振り飛車は28%選ばれます。

棋譜生成していただいてる方はバージョンアップをお願いします。
v45
https://github.com/kobanium/aobazero/releases/tag/v45
今までは振り飛車を0.26%しか生成してなかったのが28%に増えたのが一番大きな違いです。
棋譜に多様性が生まれて強くなることを期待してます。
73337037 棋譜以降が指定局面形式になります。
今までは全ての着手にコメント(探索情報)が入っていますが
0手から60手まで入らない場合があります。