TOP
> 記事閲覧
AobaZeroの自己対局
| 件名 | : Re: AobaZeroの自己対局 |
| 投稿日 | : 2024/05/02(Thu) 13:00 |
| 投稿者 | : 山下 |
| 参照先 | : |
RunPodで借りた4090 1枚、だと
363棋譜/時間 (7時間後) Device O-1:28:65W , SleepOpenCL 0
416棋譜/時間 (3時間後) Device O-1:28:73W , SleepOpenCL 1
400を超えるようです。CPU負荷が相当高く、load average では 44 も使っていました。
そんなに重くないはずなのですが。CPUが遅い?のかも。
同時に走らせるプロセス数は73が限界で、それ以上だとエラーになってました。
Device O-1:42:126W とかだともう少し伸びると思います。
CPU : AMD EPYC 7B13 64-Core Processor, 1500 MHz?
32 vCPU 125 GB RAM , (cat /proc/cpuinfo では255 vCPU見えます)
load average: 25.19, 43.11, 44.45
ubuntu 22.02
(2024/06/10追記)
4090を購入して試してみました。468棋譜でした。
load averageは17ぐらいで、12コアだと少し足りないようです。
468棋譜/時間 (3時間後) Device O-1:42:126W, SleepOpenCL 1
Ryzen 9 7900 (12コア、24スレッド), Ubuntu 24.04
load average: 18.56, 19.59, 17.67
363棋譜/時間 (7時間後) Device O-1:28:65W , SleepOpenCL 0
416棋譜/時間 (3時間後) Device O-1:28:73W , SleepOpenCL 1
400を超えるようです。CPU負荷が相当高く、load average では 44 も使っていました。
そんなに重くないはずなのですが。CPUが遅い?のかも。
同時に走らせるプロセス数は73が限界で、それ以上だとエラーになってました。
Device O-1:42:126W とかだともう少し伸びると思います。
CPU : AMD EPYC 7B13 64-Core Processor, 1500 MHz?
32 vCPU 125 GB RAM , (cat /proc/cpuinfo では255 vCPU見えます)
load average: 25.19, 43.11, 44.45
ubuntu 22.02
(2024/06/10追記)
4090を購入して試してみました。468棋譜でした。
load averageは17ぐらいで、12コアだと少し足りないようです。
468棋譜/時間 (3時間後) Device O-1:42:126W, SleepOpenCL 1
Ryzen 9 7900 (12コア、24スレッド), Ubuntu 24.04
load average: 18.56, 19.59, 17.67
| 件名 | : Re: AobaZeroの自己対局 |
| 投稿日 | : 2024/04/15(Mon) 18:20 |
| 投稿者 | : 山下 |
| 参照先 | : |
コアごときれいに分散されているか、はよく分かりません。
Device O-1:28:85W
の設定なら3090で起動直後がCPUが600%程度で、起動後2時間ぐらいで
800%から1000%ぐらいになる印象です。Linuxの場合。
3090で190棋譜/時、ならほぼ最大性能に近い感じはするのですが。
Device O-1:28:85W
の設定なら3090で起動直後がCPUが600%程度で、起動後2時間ぐらいで
800%から1000%ぐらいになる印象です。Linuxの場合。
3090で190棋譜/時、ならほぼ最大性能に近い感じはするのですが。
| 件名 | : Re: AobaZeroの自己対局 |
| 投稿日 | : 2024/04/15(Mon) 06:49 |
| 投稿者 | : 48 |
| 参照先 | : |
言葉足らずですみません。
全コア負荷ではなく1コアのみの負荷集中で頭打ちになっている風に見えたのでコメントしました。
うちの3090だと190毎時くらいですのでもしかしたらCPUボトルネックでしょうか。
全コア負荷ではなく1コアのみの負荷集中で頭打ちになっている風に見えたのでコメントしました。
うちの3090だと190毎時くらいですのでもしかしたらCPUボトルネックでしょうか。
| 件名 | : Re: AobaZeroの自己対局 |
| 投稿日 | : 2024/04/12(Fri) 12:16 |
| 投稿者 | : 山下 |
| 参照先 | : |
棋譜生成ありがとうございます。
8コアマシンでタスクマネージャで800%以上使ってる場合は、最大性能は出ていないと思います。
また、 autousi.cfg で
SleepOpenCL 1
にするとLinuxではCPU使用率が少し下がります。そのため同一ハードなら若干Linuxの方が性能が出やすいかと思います。
先日のOpenCLのバグを取った影響か1割くらい速くなった印象なのですが、ちょっと私の環境は今、
CPUファンの性能が劣化したようでフルで動かすとマシンが落ちる、クロックが低下するので正確な数値が測れません。
2台とも。2080Tiだと100/毎時、3090だと150/毎時ほどでした。どちらもLinuxです。
8コアマシンでタスクマネージャで800%以上使ってる場合は、最大性能は出ていないと思います。
また、 autousi.cfg で
SleepOpenCL 1
にするとLinuxではCPU使用率が少し下がります。そのため同一ハードなら若干Linuxの方が性能が出やすいかと思います。
先日のOpenCLのバグを取った影響か1割くらい速くなった印象なのですが、ちょっと私の環境は今、
CPUファンの性能が劣化したようでフルで動かすとマシンが落ちる、クロックが低下するので正確な数値が測れません。
2台とも。2080Tiだと100/毎時、3090だと150/毎時ほどでした。どちらもLinuxです。

比べてRTX 4090が300ちょっとくらいなのであまり伸びていないようで、見るとCPU側が1スレッド頭打ちの雰囲気です。
Windows11環境ですがLinux環境でも似たようなもんでしょうか。