コンピュータ将棋や囲碁の掲示板
TOP > 記事閲覧
fld_nor.gif AobaZeroの2024年選手権のメモ
投稿日 : 2024/05/06(Mon) 23:23
投稿者 山下
2次予選は4勝3敗2分の12位でした。
今回はAobaZeroの棋譜を使ってdlshogiのモデルを作って参加したのですが
dlshogiの学習を含め、作りこんである優秀さを再確認した、という感じです。
384x30b、7200万パラメータ、で参加したのですが、1手3秒だと150 ELOほどAobaZeroより強いです。
またRunPodで4090を12枚、1時間6.5$(約1000円)という破格の値段で借りれたのも大きいです。
dlshogiは8GPUまでだったのですが少しの改良であっさり動いて12枚でNPSが26万ほど出ていました。
大会当初は12枚なので最大GPU枚数かな?と思ったのですが、谷合さんは14枚使っていて、決勝の
やねこま王は18枚をvast.aiから借りてたそうです。
今回混戦になった要素は、こういった低価格でGPUを複数使える環境が増えて、上位のハードの
優位性がなくなったのも大きいと思います。

昨年、角換わりの後手番定跡で痛い目に会ったので、何とかしたいと思ったのですが
結局、後手番なら2手目△32金とか2手目△34歩から△44歩で角道を止める、という方針で行きました。
koronが強そうだったので、ponkotsuの竹内さんから千日手狙いで
Draw_Value_Black=300
Draw_Value_White=700
で千日手の勝率を70%にするといい、と聞き、ちょっとひよって400、600にしたのですが普通に完敗。
もっと思い切りが大事ですね。
6戦目のHoneyWaffleにはfloodgateでぼこぼこにされてて、かつAobaZeroの振飛車評価が極端に低いので
厳しいか、と思ったのですが4090 x12の効果が出てか幸いしました。
floodgateのHoneyWaffleはminiPC(でも結構速い)で、検討はAWSで、これに相当お金がかかってる、と聞いてびっくりしました。
7戦目の技巧は事前に負けた方が脱落かなぁ、みたいな話で、Aobaが先手だったのもあり相掛かりの単調曲線で
そのまま押し切り、かと思ったのですが宣言勝ちが下手で320手に。
8戦目は水匠に後手で、まぁあっさり負けるだろう、と△34歩から△44歩で角道を止める変化にしたのですが
意外なことに水匠が定跡がなかったこともあり、中盤で運よく逆転。しかしまたも宣言できずに320手に。むー。
最終戦は、勝った方が決勝、という一番で谷合さんのPolonaiseに。ここはめちゃくちゃ先手が欲しかったのですが
後手番に。ここまで8試合でお互い先手、後手4局ずつだったので、先後は乱数だったと思います。
△34歩から△44歩で、昭和風の見ていて面白い将棋に。最後相入玉か、と思ったのですが谷合さんの
これは桂が効いてるので難しい(略)、とかなり高度な大局観でその通りになったのでさすがでした。
負けたのは残念ですが将棋は面白かったです。

定跡はfloodgateでAobaZeroが指した棋譜の手番の局面だけ11000局面ほど1手1分(3090 1枚)で作っていたのですが
4090 x12 が予想以上に速く、1手5分で作った940局面がそこそこhitしていました。

結果的に負けた3局は全部後手番で、グラフもよくある単調増加曲線、で改めて後手番難しいな、という印象です。

下は大会で使ったdlshogi互換の重みです。dlshogi_dr2 よりは同じ思考時間だと明確に弱いです。
20240329_153000_model_resnet30x384_relu_027.onnx
https://drive.google.com/file/d/193pFFbHjWYjdwZUiMQnMIUND4ujRc7CV/view?usp=sharing
編集 編集
件名 Re: AobaZeroの2024年選手権のメモ
投稿日 : 2024/05/21(Tue) 06:46
投稿者 shogicomp
参照先
回答ありがとうございます。

私の環境ではRTX2070の以下環境で問題が起きていました。
trt7.2.3.4
cuda-11.1

その後runtime版では動作したことや、別のGTX1050の以下環境では動作したことから、ファイルには問題ないことはわかったので、CUDAあたりが怪しいのかなと考えていました。
trt7.2.1.6
cuda-11.1

dlshogiのbuild_onnx.exeに通してみると、buildEngineWithConfigというエラーメッセージ?が表示され手がかりができましたので、こちらで調べてみようと思います。
編集 編集
件名 Re: AobaZeroの2024年選手権のメモ
投稿日 : 2024/05/20(Mon) 04:29
投稿者 山下
参照先
RunPod、RTX 4090 x12で動かしたときは以下の環境でした。
TensorRT-8.6.1.6
cuda-11.8
自宅のRTX 3090だと
trt8.0.1.6
cuda-11.2

アップロードに失敗したかも、とダウンロードして試してみましたが
変換はできるようです。
ただ、実行してるソースは2023年5月24日のgithubの内容です。
2021年のdlshogi_dr2_exhi のソースでも変換はOKでした。
Linux環境でしか試していないのですが。

$ /home/yss/shogi/dlshogi_20230524/usi/bin/usi
usi
...
usiok
setoption name DNN_Model value /home/yss/20240329_153000_model_resnet30x384_relu_027.onnx
setoption name Draw_Ply value 320
setoption name USI_Ponder value true
setoption name Resign_Threshold value 0
setoption name UCT_NodeLimit value 50000000
isready
...
readyok

-rw-r--r--   1 yss  yss   322228182 May 20 04:13 20240329_153000_model_resnet30x384_relu_027.onnx
-rw-rw-r--   1 yss  yss   161603801 May 20 04:18 20240329_153000_model_resnet30x384_relu_027.onnx.0.128.serialized
編集 編集
件名 Re: AobaZeroの2024年選手権のメモ
投稿日 : 2024/05/20(Mon) 00:48
投稿者 shogicomp
参照先
はじめまして。
山下様が大会で使われたdlshogi互換モデルを試してみようと思ったのですが、Serializedキャッシュの作成に失敗して動作しないです。
TensorRT7.2.3.4とCUDA11.1を使用しているのですが、参考のため山下様のモデル作成環境ではTensorRTやCUDAはどのバージョンを使われたか差し支えなければ教えていただけないでしょうか。
編集 編集
件名 Re: AobaZeroの2024年選手権のメモ
投稿日 : 2024/05/07(Tue) 13:03
投稿者 山下
参照先
谷合さんは自然言語処理で将棋のNNを作っているのが特徴ですが
(入力に盤面の9x9の駒位置を画像のように与えるのがdlshogiなどで一般の形式で、画像でなく文章形式で与えてます)
今回、BERT large、というモデルを使われたそうで実に3億4000万パラメータ、
通常の256x20bのAobaZeroが2300万、384x30bで7200万なので、5倍近い巨大さです。
それだけ大きくても過学習はしにくいそうです。
ただNPSは4090 1枚で800程度、とかなり遅く(384x30bだと21000)、それでもあれだけ強いのは
やっぱり将棋は評価関数なのかな、と思わせます。
1手1playoutだとfloodgateで2600ぐらいで、おそらく過去最高の強さだと思います。
http://wdoor.c.u-tokyo.ac.jp/shogi/view/show-player.cgi?event=LATEST&filter=floodgate&show_self_play=1&user=nosearch1gou&range=365
BayesEloでの測定でもYss1000kより100ぐらい弱い程度です。
http://www.yss-aya.com/floodgate/result2024.html

プロのトップがおそらく3150程度(プロの平均は2700?)なので
まだPolicyだけで人間を超えるまでは行ってないと思います。

Re: プロ棋士とfloodgateのレート 
http://www.yss-aya.com/bbs_log/bbs2021.html#bbs23
編集 編集
件名 スレッドをトップへソート
名前
画像添付


暗証キー
画像認証 (右画像の数字を入力「四三」なら「43」) 投稿キー
コメント

- WEB PATIO -