TOP
> 記事閲覧
nnue-pytorchより3倍高速に学習できるbullet
| 件名 | : Re: nnue-pytorchより3倍高速に学習できるbullet |
| 投稿日 | : 2025/12/06(Sat) 09:04 |
| 投稿者 | : 山下 |
| 参照先 | : |
おぉ素晴らしい!
一度試してみようと思います。
情報ありがとうございました。
一度試してみようと思います。
情報ありがとうございました。
| 件名 | : Re: nnue-pytorchより3倍高速に学習できるbullet |
| 投稿日 | : 2025/12/06(Sat) 06:47 |
| 投稿者 | : ihme_vaeltaa |
| 参照先 | : |
Stoat開発者のCiekceさんがForkしたレポジトリに、将棋のブランチもあるようです。
https://github.com/Ciekce/bullet/tree/shogi
https://github.com/Ciekce/bullet/tree/shogi2
https://github.com/Ciekce/bullet/tree/shogi
https://github.com/Ciekce/bullet/tree/shogi2

NNUEの学習でbulletを使うとnnue-pytorchより3倍速く学習できるそうです。
4bitとかでなく、ちゃんと32bitで計算してるらしいです。
どういう仕組みなのか分かっていませんが・・・。
deepwikiで質問すると以下が特徴らしいです。残念ながら将棋対応版はまだなさそうです。
-----
最適化されたCUDAカーネル: NNUE特有の疎行列演算や融合活性化関数のためのカスタムカーネルを実装
グラフベースの計算: ネットワークを事前に定義し、特定のハードウェアバックエンド向けに最適化・コンパイル
マルチGPUサポート: NCCLを使用したデータ並列処理(CUDAバックエンドのみ)
-----
https://github.com/jw1912/bullet
deepwikiによる解説
https://deepwiki.com/jw1912/bullet