コンピュータ将棋や囲碁の掲示板
TOP > 記事閲覧
fld_nor.gif KataGoはTensorRTの48スレッドぐらいが最速
投稿日 : 2024/12/06(Fri) 15:23
投稿者 山下
最新のソースのKataGoでベンチマークを取ってみました。
GPU : RTX 4090
CPU : Ryzen 9 7900, 12コア 24スレッド

maxVisits = 10000
numSearchThreads = 6
のスレッド数を6,12,24,48,96 と変えた場合です。
TensortRTで48スレッドが一番速かったです。NPSは 3000局面/秒 ぐらいでした。

スレッド数    OpenCL  CUDA  TensorRT
      6        17.9   12.7   10.5 秒
     12        12.4    8.9    6.9
     24        10.2    8.4    4.4
     48         7.5    4.4    3.3
     96         7.6    5.2    3.3

初手から3手進めて4手目の白を打った時にかかった秒数です。

play b d7
genmove w
play b r10
genmove w

重みは下です。
kata1-b28c512nbt-s8032072448-d4548958859.bin.gz

CUDA 12.4
TensorRT 8.6.1.6, (cuda_11.8)
編集 編集
件名 スレッドをトップへソート
名前
画像添付


暗証キー
画像認証 (右画像の数字を入力「四三」なら「43」) 投稿キー
コメント

- WEB PATIO -