コンピュータ将棋や囲碁の掲示板
TOP
>
過去ログ
> 記事閲覧
GPWでの印象的な発表と、「将棋の棋譜から対局者名を深層学習で推測」の資料
投稿日
: 2022/11/19(Sat) 10:11
投稿者
:
山下
GPWで「将棋の棋譜から対局者名を深層学習で推測」という発表をしました。
アマだと99%、プロは57%を20棋譜(学習80棋譜)で当てることができました。
チェスでもそうだったのですが、アマの棋譜(ネット将棋の棋譜)は
簡単に個人が識別できるのに驚きました。
「将棋の棋譜から対局者名を深層学習で推測」
https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=222009&item_no=1&page_id=13&block_id=8
GPWでの資料
http://www.yss-aya.com/20221119gpw_name.pdf
他にGPWで面白かった将棋関連の発表は
・順位戦のA級だけはAIの影響で棋力が上がってる。
・AIとの一致率は、順位戦の棋譜だと50年前から単調に増加してる
などが分かった、
「将棋AIがプロ棋士の棋譜に与えた影響 ―定量的分析からの考察― 」
https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=222008&item_no=1&page_id=13&block_id=8
・勝った将棋にgoodが押されやすい
・待った、をして勝ってもgoodは押されにくい
・惜しくもポスター優秀賞で次点
などの、山田元気さんの、
「きのあ将棋囲碁サイト good,bad 投稿分析とAIについて」
https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=222012&item_no=1&page_id=13&block_id=8
・100分の1のミニバッチでATARIゲームで性能低下が起きない手法
Policyの分布の違いとかTD誤差でreplay bufferから選ぶ手の確率を変える手法が色々ある、と
勉強になった、
「Surprise とOn-policyness に基づく優先度による省メモリな強化学習」
https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=222020&item_no=1&page_id=13&block_id=8
KataGoのPolicy surprize weight もそうですけど、AobaZeroもこういうった指標でリプレイバッファから
サンプルを選ぶ確率を変えるのを試してみようと思います。
今までの棋譜生成の段階で、RawなNNの出力(Policy、Value)も棋譜に保存しておけばよかった、と思いました。
-
WEB PATIO
-
アマだと99%、プロは57%を20棋譜(学習80棋譜)で当てることができました。
チェスでもそうだったのですが、アマの棋譜(ネット将棋の棋譜)は
簡単に個人が識別できるのに驚きました。
「将棋の棋譜から対局者名を深層学習で推測」
https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=222009&item_no=1&page_id=13&block_id=8
GPWでの資料
http://www.yss-aya.com/20221119gpw_name.pdf
他にGPWで面白かった将棋関連の発表は
・順位戦のA級だけはAIの影響で棋力が上がってる。
・AIとの一致率は、順位戦の棋譜だと50年前から単調に増加してる
などが分かった、
「将棋AIがプロ棋士の棋譜に与えた影響 ―定量的分析からの考察― 」
https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=222008&item_no=1&page_id=13&block_id=8
・勝った将棋にgoodが押されやすい
・待った、をして勝ってもgoodは押されにくい
・惜しくもポスター優秀賞で次点
などの、山田元気さんの、
「きのあ将棋囲碁サイト good,bad 投稿分析とAIについて」
https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=222012&item_no=1&page_id=13&block_id=8
・100分の1のミニバッチでATARIゲームで性能低下が起きない手法
Policyの分布の違いとかTD誤差でreplay bufferから選ぶ手の確率を変える手法が色々ある、と
勉強になった、
「Surprise とOn-policyness に基づく優先度による省メモリな強化学習」
https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=222020&item_no=1&page_id=13&block_id=8
KataGoのPolicy surprize weight もそうですけど、AobaZeroもこういうった指標でリプレイバッファから
サンプルを選ぶ確率を変えるのを試してみようと思います。
今までの棋譜生成の段階で、RawなNNの出力(Policy、Value)も棋譜に保存しておけばよかった、と思いました。