본문 바로가기

Dev

[개발환경] RTX 4090 Ubuntu 22.04 딥러닝 학습 서버 환경 구축 (1)

전체 순서는 아래와 같이 진행

(1) Nvidia Graphic Driver,  CUDA,  cuDNN 설치

(2) Anaconda 및 Pytorch 설치

아나콘다와 파이토치 설치가 필요하다면 여기

2023.04.19 - [Dev] - [개발환경] RTX 4090 Ubuntu 22.04 딥러닝 학습 서버 환경 구축 (2)

 


 

이번 포스팅은 (1) 엔비디아 그래픽 드라이버, CUDA 그리고 cuDNN까지 설치하는 방법이다

 

GeForce RTX 4090 2way 학습용 서버로 구매

  • Ubuntu 22.04
  • CUDA 12.0

구매처에서 os랑 cuda 설치 해주신다 하셔서 위 version 으로 부탁

근데 CUDA 12.0과 맞는 pytorch version이 없어서 지우고 재설치 해야하는 상황 

 

이거는 기본으로 설치해주기

 

sudo apt-get update
sudo apt install -y ubuntu-drivers-common

 


 

0. Cuda 재설치 == 전체 삭제

*만약 재설치가 아니라면 이 부분은 건너뛰고 1번부터 진행*

 

sudo apt-get purge nvidia*
sudo apt-get autoremove
sudo apt-get autoclean
sudo rm -rf /usr/local/cuda*

 

nvidia-smi 와 nvcc -V 했을 때 아무것도 안나오면 성공

 

 

1. 구성 확인 및 Nvidia Graphic Driver 설치

1.1 cuda-capable 한 gpu 인지 확인

 

lspci | grep -i nvidia

 

GPU 2개여서 2개 뜸

 

1.2 distribution과 release number 확인

 

uname -m && cat /etc/*release

 

내 경우 ubuntu 22.04 설치 된 것 확인 완료

 

1.3 cuda toolkit 사용하려면 gcc compiler가 필요하기 때문에 사전에 확인

 

gcc --version

 

만약 없다면 development tools 설치

 

sudo apt update
sudo apt install build-essential

 

1.4 kernel version 확인 및 올바른 kernel headers 설치

 

uname -r
sudo apt-get install linux-headers-$(uname -r)

 

1.5 그래픽 카드 확인

 

sudo lshw -numeric -C display

 

1.6 Compatible 한 version 확인

 

sudo ubuntu-drivers devices

 

recommended version 확인 가능

 

권장 버전 확인 후 혹시 모르니 https://docs.nvidia.com/deploy/cuda-compatibility/ 에서 최소 권장 version도 확인

 

내 경우 450 이상으로 설치

 

 

1.7 원하는 버전 설치 (다른 버전 설치 시 525 변경)

 

sudo apt install nvidia-driver-525
sudo reboot

 

1.8 reboot 후 명령어 입력 시 제대로 출력되면 성공

 

nvidia-smi

 

예쁘다

 

*NOTE*

여기서 나오는 CUDA Version 는 설치 된 version이 아닌 compatible 한 version을 보여주는 것

 

 

2.  Cuda 11.7 설치 Cuda 11.8 설치

2.1 https://developer.nvidia.com/cuda-toolkit-archive 에서 필요한 버전으로 설치

 

내 환경과 맞는 설정 클릭 클릭

 

 

2.2 아래 코드 실행

그대로 복붙

 

CUDA 11.7 설치 경우

 

wget https://developer.download.nvidia.com/compute/cuda/11.7.1/local_installers/cuda_11.7.1_515.65.01_linux.run

sudo sh cuda_11.7.1_515.65.01_linux.run

 

CUDA 11.8 설치 경우

 

wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run

sudo sh cuda_11.8.0_520.61.05_linux.run

 

*Note*

기존에 11.7로 설치했지만 torchaudio와 호환 문제 때문에 cuda 11.8 버전으로 변경 (04월25일)

아래 진행 과정은 쿠다 버전과 상관없기 때문에 그대로 진행해도 무방하다

 

2.3 아래 화면이 뜨면 순차적으로 진행

 

무시하고 continue
제게 권한이 있나요 accept

 

*NOTE*

이미 호환되는 driver 확인 후 설치하였으니 여기서 driver는 해제하고 설치한다

 

'Enter' 로 고르기

설치가 완료되면 아래처럼 뜬다

여기서 뜨는 WARNING은 graphic driver를 같이 설치하지 않아서 뜨는 것

때문에 호환되는 드라이버를 설치하였다면 무시해도 무방하다

 

 

2.4 설치 후 경로 설정을 해줘야 진짜 끝난다

 

sudo nano ~/.bashrc

 

제일 아래에 두 줄 추가

(cuda-11.7로 경로설정 해줘도 되지만 cuda 버전 여러 개 설치할 가능성도 있기에 cuda로 했다)

 

export PATH="/usr/local/cuda/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda/lib64:$LD_LIBRARY_PATH"

 

수정된 bashrc 적용

 

source ~/.bashrc

 

2.5 명령어 입력 시 제대로 출력되면 성공

 

nvcc -V

 

CUDA 11.7 버전 잘 설치 됨

 

 

3. cuDNN 설치

3.1 https://developer.nvidia.com/rdp/cudnn-archive 로 이동 후 로그인 및 동의하고 버전에 맞는 cuDNN 다운로드

나의 경우 CUDA 11.7을 설치했기 때문에 11.x 리눅스용으로 다운로드

 

 

3.2 tar.xz로 압축된 파일을 풀어준다 (tar -xvf 뒤에 풀고자 하는 파일명 기입)

tar로 압축하고 xz로 한번 더 압축 한 것 같은데 그 이유는 xz는 효율은 좋으나 한 개의 파일만 압축 할 수 있어서 tar로 먼저 묶어주고 xz로 압축한 것 같다.

 

tar -xvf cudnn-linux-x86_64-8.8.1.3_cuda11-archive.tar.xz

 

3.3 압축 풀린 파일들을 /ur/local/로 복붙 및 권한 설정

 

sudo cp cudnn-linux-x86_64-8.8.1.3_cuda11-archive/include/cudnn*.h /usr/local/cuda/include
sudo cp cudnn-linux-x86_64-8.8.1.3_cuda11-archive/lib/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

 

3.4 명령어 입력 시 제대로 출력되면 성공

 

cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

 

cuDNN v8.8.1 설치 끝