dlshogiを落とす。 $ git clone https://github.com/TadaoYamaoka/DeepLearningShogi.git dlshogi $ cd dlshogi/usi Makefile を修正 INCLUDE = -I../usi -I../cppshogi -I/usr/local/cuda-11.8/include -I/root/TensorRT-8.6.1.6/include LIB = -L/usr/local/cuda-11.8/lib64 -L/root/TensorRT-8.6.1.6/lib $ export LD_LIBRARY_PATH=/root/TensorRT-8.6.1.6/lib:$LD_LIBRARY_PATH $ make
単純に下を実行すると tensorrt 10.0.1.6-1+cuda12.4 が入り、 # apt-get install tensorrt 下のエラーで止まってはまりました。 nn_tensorrt.cpp:91:18: error: 'class nvinfer1::IBuilder' has no member named 'setMaxBatchSize'; did you mean 'getMaxDLABatchSize'?
Community Cloudから
runpod/pytorch:2.0.1-py3.10-cuda11.8.0-devel-ubuntu22.04
4090、GPUは2つを選択。Deploy。
Connect、Basic SSH Terminal: (No support for SCP & SFTP) でログイン。... SCPありの場合も。
標準でCUDA 11.8が入っている。Ubuntu 22.04
「cuDNN 8.9.0 for CUDA 11.x」をインストール。
https://developer.nvidia.com/rdp/cudnn-archive
上から下を落とす。
cudnn-local-repo-ubuntu2204-8.9.0.131_1.0-1_amd64.deb
# dpkg -i cudnn-local-repo-ubuntu2204-8.9.0.131_1.0-1_amd64.deb
「run this command」のメッセージに従って
# cp /var/cudnn-local-repo-ubuntu2204-8.9.0.131/cudnn-local-2063C34E-keyring.gpg /usr/share/keyrings/
# apt update
# apt install libcudnn8=8.9.0.131-1+cuda11.8
# apt install libcudnn8-dev=8.9.0.131-1+cuda11.8
# dpkg -l | grep cudnn
TensorRT 8.6 GA for Linux x86_64 and CUDA 11.0, 11.1, 11.2, 11.3, 11.4, 11.5, 11.6, 11.7 and 11.8 TAR Package を落とす。(3KB程度のファイルしか落ちない場合はログインしてブラウザで落とす)
# wget https://developer.nvidia.com/downloads/compute/machine-learning/tensorrt/secure/8.6.1/tars/TensorRT-8.6.1.6.Linux.x86_64-gnu.cuda-11.8.tar.gz
# tar xvf TensorRT-8.6.1.6.Linux.x86_64-gnu.cuda-11.8.tar.gz
dlshogiを落とす。
$ git clone https://github.com/TadaoYamaoka/DeepLearningShogi.git dlshogi
$ cd dlshogi/usi
Makefile を修正
INCLUDE = -I../usi -I../cppshogi -I/usr/local/cuda-11.8/include -I/root/TensorRT-8.6.1.6/include
LIB = -L/usr/local/cuda-11.8/lib64 -L/root/TensorRT-8.6.1.6/lib
$ export LD_LIBRARY_PATH=/root/TensorRT-8.6.1.6/lib:$LD_LIBRARY_PATH
$ make
単純に下を実行すると tensorrt 10.0.1.6-1+cuda12.4 が入り、
# apt-get install tensorrt
下のエラーで止まってはまりました。
nn_tensorrt.cpp:91:18: error: 'class nvinfer1::IBuilder' has no member named 'setMaxBatchSize'; did you mean 'getMaxDLABatchSize'?
RunPod
https://www.runpod.io/console/deploy