cuda, cudnn 확인 및 맞는 tensorflow_gpu 버전 설치하기

2020. 4. 22. 19:12꿀팁 분석 환경 설정/Linux 관련 팁

광고 한 번씩 눌러주세요! 블로그 운영에 큰 힘이 됩니다 :)

cuda 버전 확인하기

nvcc --version

cudnn version 확인하기

cat /usr/include/x86_64-linux-gnu/cudnn_v*.h | grep CUDNN_MAJOR -A 2

 

 그래픽 카드 이름 확인하기

nvidia-smi --query | fgrep 'Product Name'

 

그래픽 카드별 계산 능력 확인

 

URL : https://developer.nvidia.com/cuda-gpus#collapse2

현재 Titan Xp를 사용하려고 하고 Compute Capability는 6.1
내가 이번에 설치하고 싶은 Cuda Version은 10.0 
cuda 10.0는 3.0~7.5까지 호환된다고 하니 가능하다는 것 확인

 

URL : https://en.wikipedia.org/wiki/CUDA

 

텐서플로우 유저이기 때문에 각 텐서플로우 버전마다 호환되는 버전 확인
그중에서도 GPU버전을 1.14를 사용하려고 한다
그러면 최소 Cuda는 10버전이여야하며, cuDNN은 7.4 그리고 파이썬 버전은 3.3~3.7 이여야 한다는 정보가 있다.

URL : https://www.tensorflow.org/install/source#tested_build_configurations

 

현재 나는 아래와 같은 오류에서 허덕이고 있다.

cov1d를 좀 쓰려고 하는데 "Failed to get convolution algorithm" 이라는 문제에 허덕였다.

UnknownError: Failed to get convolution algorithm. This is probably because cuDNN failed to initialize,

tensorflow 1.15에서 일단 안돼서 1.14로 넘어갔고 또 안돼서 1.13.1로 넘어갔다.
그 과정에서 1.13.1에서 여전히 GPU 사용은 안되지만 CPU에서 conv1d를 사용할 수 있었다.

 W = tf.get_variable("conv_w", [7, 1, 7])
 W1 = tf.get_variable("conv_w2", [7, 7, 3])
 LAYER1 = tf.nn.conv1d(x, spectral_norm(W, "u1"), 1, "VALID")

왜 안되는 걸까...

728x90