コンピュータ将棋や囲碁の掲示板
TOP
> 記事閲覧
KataGoはTensorRTの48スレッドぐらいが最速
投稿日
: 2024/12/06(Fri) 15:23
投稿者
:
山下
最新のソースのKataGoでベンチマークを取ってみました。
GPU : RTX 4090
CPU : Ryzen 9 7900, 12コア 24スレッド
で
maxVisits = 10000
numSearchThreads = 6
のスレッド数を6,12,24,48,96 と変えた場合です。
TensortRTで48スレッドが一番速かったです。NPSは 3000局面/秒 ぐらいでした。
スレッド数 OpenCL CUDA TensorRT
6 17.9 12.7 10.5 秒
12 12.4 8.9 6.9
24 10.2 8.4 4.4
48 7.5 4.4 3.3
96 7.6 5.2 3.3
初手から3手進めて4手目の白を打った時にかかった秒数です。
play b d7
genmove w
play b r10
genmove w
重みは下です。
kata1-b28c512nbt-s8032072448-d4548958859.bin.gz
CUDA 12.4
TensorRT 8.6.1.6, (cuda_11.8)
編集
件名
スレッドをトップへソート
名前
画像添付
暗証キー
画像認証
(右画像の数字を入力「四三」なら「43」)
コメント
-
WEB PATIO
-
GPU : RTX 4090
CPU : Ryzen 9 7900, 12コア 24スレッド
で
maxVisits = 10000
numSearchThreads = 6
のスレッド数を6,12,24,48,96 と変えた場合です。
TensortRTで48スレッドが一番速かったです。NPSは 3000局面/秒 ぐらいでした。
スレッド数 OpenCL CUDA TensorRT
6 17.9 12.7 10.5 秒
12 12.4 8.9 6.9
24 10.2 8.4 4.4
48 7.5 4.4 3.3
96 7.6 5.2 3.3
初手から3手進めて4手目の白を打った時にかかった秒数です。
play b d7
genmove w
play b r10
genmove w
重みは下です。
kata1-b28c512nbt-s8032072448-d4548958859.bin.gz
CUDA 12.4
TensorRT 8.6.1.6, (cuda_11.8)