コンピュータ将棋や囲碁の掲示板
TOP > 記事閲覧
fld_nor.gif 久しぶりに決勝に進めた選手権
投稿日 : 2025/05/07(Wed) 15:16
投稿者 山下
AobaZeroは今回初めて決勝に残ることができました。
YSSで進めた最後が2015年の第25回なので、個人としても10年ぶりの決勝でした。

昨年と同様、エンジンはAobaZeroでなくdlshogiを変更したものを使っています。
今回の一番大きな変更点はゼロから強化学習したAoba振り飛車の棋譜を20%程度混ぜたことです。
小さな重みでは50ELOほど強くなり本番で使った384x30bのResNetでも対水匠5で+50 ELO、
1年前のモデルだと+20 ELO程度強くなっています。
他にNNの入力に手番、手数を追加して歩の枚数も8枚Maxでなく18枚までに。
手数は190手以上から40手ごとに区切って0(190以下)から8(470以上)の9種類に分けてます。
小数点で与えたかったのですが、dlshogiは高速化のため0、1のONE HOT専用になってるので
こうしています。
また宣言勝ちしやすいように400手で敵陣に5枚なのに勝率95%、とかは無理やり60%ぐらいに
下げて学習局面をいじってます。
選手権は321手で引き分けなので、160手は200手、321手は513手、にsigmoidで変換してNNの
入力にしています。
学習は合計で3億3000万局面をcos annealingで60 EPOC(1650万局面 * 20 * 3)繰り返して3090で10日間でした。
定跡はfloodgateでAobaZeroの対局でAobaZeroの手番で出てきた局面のみを1手500万ノード考えさせて、
3800局面ほどを登録してます。4090 x14だとNPSは28万/秒なので大会だと17秒相当なので
1000万ノードで作った方がよかったかもでした。

1回戦のやねうら王は38手目まで相掛かりの変化を定跡で指されてほぼ互角の評価で抜けており、
計算力での事前準備で負けた気がします。先手番で負けたのは3年ぶりで、ここを落としたのは
かなり痛かったです。

2回戦のあすとら将棋は1GPUで2年連続で8位以内に入っており、モデル単体では最強レベルかと思います。
後手番で角換わり定跡で負けるのは避けたいので今年も2手目△34歩から△44歩で角道を止める作戦でした。
後手番で勝てる気はあまりなかったのですが、運よく勝勢に。しかし勝ちになってからまったく寄せにいかず
お互い穴熊の位置に王がいるまま320手の引き分けに。持将棋だけでなく、勝率99%だとMCTSは無力なので
駒得で勝率が80-100%ぐらいは単調増加するような学習局面の補正が必要かもしれません。

3回戦のもふ将棋はiPhoneを30台!繋げて多数決合議する、という挑戦的なプラグラムで
30個の多数決画面は見てるだけで面白いです。

4回戦は1次予選を7-1の1位で抜けた習甦。アピール文書が4行で難しかったのですが、お話を聞くと
MCTSとαβを同時に動かして終盤でαβが+1000と点数を付けた局面をハッシュに覚えて
MCTSがそのノードに末端で来て値を戻す時、Valueが勝率0.55とかなら、+1000なので+0.70とか補正して
戻す、つまり終盤ではαβ法の方が優秀なのでその値を利用する、という今までにないタイプの
MCTSとαβの共存利用で面白いアイデアでした。まだどのくらい強くなったか、といったデータは
ないそうですが。

5回戦の名人コブラは双方が相手の方がいいと思う、を妙な局面が長い、評価値グラフも少し不思議な展開でした。
コブラが初手▲76歩だったのは少し意外でした。

6回戦は初参加のKanade。千日手模様が100手近く続き後手のKanadeから打開。かなり悪くなったのですが
220手ぐらいから入玉できそうな展開になり逆転。しかし宣言には手数が足りず320手に。

7回戦は谷合さんのSerenade。昨年、最終戦で後手番で負けて決勝に行けなかった借りを
先手番で返せるか、と思ったのですが相掛かりで普通に悪くなって敗北。

8回戦はponkotsu。生き残りをかけた一戦です。
勝又さんに隣でずっと解説していただいたのですが、84手目の△72飛が好手で▲75歩は△同飛▲同金だと
詰むか、▲43銀を馬で抜く変化で勝ちになるそうで、決め手だったそうです。
ponkotsuは今回後手番で全部勝ち、先手だと全部負け、という変わった結果でした。

9回戦は5勝組がAobaZeroとKanadeしかおらず、引き分けだとかなりの確率で決勝に行けそうだったので
Draw_Value_Black=100,Draw_Value_White=900 で引き分けなら90%で勝ち、にして引き分け狙いにして
Ryfamate相手で運よく引き分けに。狙い通り8位で決勝に残りました。
編集 編集
件名 Re: 久しぶりに決勝に進めた選手権
投稿日 : 2025/05/12(Mon) 13:24
投稿者 山下
参照先
ご指摘ありがとうございます。
修正しました。
編集 編集
件名 Re: 久しぶりに決勝に進めた選手権
投稿日 : 2025/05/11(Sun) 19:40
投稿者 masa
参照先
一か所 Typo かと思われます。
>ponkotsuは今回後手番で全部勝ち、先手だと全部勝ち
>>ponkotsuは今回後手番で全部勝ち、先手だと全部負け
編集 編集
件名 Re: 久しぶりに決勝に進めた選手権
投稿日 : 2025/05/07(Wed) 15:17
投稿者 山下
参照先
決勝の1回戦はSerenade。
後手番で雁木から先に仕掛ける面白い変化でしたが負け。
谷合さんはNNUE単体でなく、DL系とのLLMを用いた融合を考えておられたそうで、やや不本意な
大会参加だったようでした。

2回戦はdlshogi。4手目△44歩の変化も35手目まで定跡で。そのままいいとこなく負け。
2手目34歩、4手目△44歩は、どうもすぐさま▲36歩から▲37銀の棒銀に組む変化ではっきりダメそうな気がします。
去年も似た変化で早々に負けたので。

3回戦はRyfamate。相掛かりで勝ちと踏み込んだ手順が壁銀がたたって△34歩で角道を止められてダメそうでした。

4回戦はINUGAMI。DL水匠とAobaZeroの重みを使った知識蒸留で+20 ELO上がったそうで、
強すぎるモデルでなく、そこそこ弱い?モデルを使う方がいい、と不思議なお話が面白かったです。

5回戦はやねうら王。手番が一緒なら24手目▲37桂でなく▲76歩に定跡を追加したのですが
逆だったので何もせずに。8手目で定跡を外れました。矢倉の将棋になり端から先攻されたものの、こらえて反撃。
後手番ながら147手で千日手に持ち込めたのはラッキーでした。

6回戦は現状1位の水匠。先手だったのもあり、盛り上げるためにもぜひ勝ちたかったのですが
相掛かりから負け。局面を高段者と級位者のモデルを交互に使って解説用の読み筋を出して
ChatGPTで文体を整える仕組みが面白かったです。

最終戦はKanade。手番が一緒だったので初手を▲26歩でなく▲76歩に。
AobaZeroが自陣を金銀6枚の低い囲いで守る面白い将棋で最後は勝ちに。
vast.aiのテンプレートの設定で4090を借りれず3090だった、とのことで計算量の差が大きかった気がします。

今回は知識蒸留で+150から+200近くELOをあげたNNUE勢がDL系を抑えたようなイメージでした。

マシンはvasi.aiから予選は4090 x12、決勝は4090 x14を借りました。
値段は安くて助かるのですが、予選では朝5時に4090 x14(m:14637 host:4535)を借りたものの、
本来450Wが385Wと制限されていて、しかもシリアライズでKilledで死ぬので放棄、
次に4090 x12(m:29473 datacenter:207289)を借りたのですが対戦テスト中に31手目で

|   4  NVIDIA GeForce RTX 4090       ERR! |   00000000:61:00.0ERR! |                 ERR! |
|ERR!  ERR! ERR!             ERR! / ERR!  | GPU is lost            |    ERR!         ERR! |

のようにGPUがたくさんERRになり停止。これも捨てて別の4090 x12を借りたら、これは大丈夫そうでした。
やねうら王もvast.aiを最初は借りてたそうで、同じマシンを借りては同じく捨ててたようで、選手権の
参加者で取り合いがあったようです。
決勝は最初のx14($5.791/hr)でOKでした。vast.ai には「Reliability 99.04%」という項目があるのですが
これが99%未満のは借りない方が良さそうです。
編集 編集
件名 スレッドをトップへソート
名前
画像添付


暗証キー
画像認証 (右画像の数字を入力「四三」なら「43」) 投稿キー
コメント

- WEB PATIO -