전체 순서는 아래와 같이 진행
(1) Nvidia Graphic Driver, CUDA, cuDNN 설치
(2) Anaconda 및 Pytorch 설치
아나콘다와 파이토치 설치가 필요하다면 여기
2023.04.19 - [Dev] - [개발환경] RTX 4090 Ubuntu 22.04 딥러닝 학습 서버 환경 구축 (2)
이번 포스팅은 (1) 엔비디아 그래픽 드라이버, CUDA 그리고 cuDNN까지 설치하는 방법이다
GeForce RTX 4090 2way 학습용 서버로 구매
- Ubuntu 22.04
- CUDA 12.0
구매처에서 os랑 cuda 설치 해주신다 하셔서 위 version 으로 부탁
근데 CUDA 12.0과 맞는 pytorch version이 없어서 지우고 재설치 해야하는 상황
이거는 기본으로 설치해주기
sudo apt-get update
sudo apt install -y ubuntu-drivers-common
0. Cuda 재설치 == 전체 삭제
*만약 재설치가 아니라면 이 부분은 건너뛰고 1번부터 진행*
sudo apt-get purge nvidia*
sudo apt-get autoremove
sudo apt-get autoclean
sudo rm -rf /usr/local/cuda*
nvidia-smi 와 nvcc -V 했을 때 아무것도 안나오면 성공
1. 구성 확인 및 Nvidia Graphic Driver 설치
1.1 cuda-capable 한 gpu 인지 확인
lspci | grep -i nvidia
1.2 distribution과 release number 확인
uname -m && cat /etc/*release
내 경우 ubuntu 22.04 설치 된 것 확인 완료
1.3 cuda toolkit 사용하려면 gcc compiler가 필요하기 때문에 사전에 확인
gcc --version
만약 없다면 development tools 설치
sudo apt update
sudo apt install build-essential
1.4 kernel version 확인 및 올바른 kernel headers 설치
uname -r
sudo apt-get install linux-headers-$(uname -r)
1.5 그래픽 카드 확인
sudo lshw -numeric -C display
1.6 Compatible 한 version 확인
sudo ubuntu-drivers devices
권장 버전 확인 후 혹시 모르니 https://docs.nvidia.com/deploy/cuda-compatibility/ 에서 최소 권장 version도 확인
1.7 원하는 버전 설치 (다른 버전 설치 시 525 변경)
sudo apt install nvidia-driver-525
sudo reboot
1.8 reboot 후 명령어 입력 시 제대로 출력되면 성공
nvidia-smi
*NOTE*
여기서 나오는 CUDA Version 는 설치 된 version이 아닌 compatible 한 version을 보여주는 것
2. Cuda 11.7 설치 Cuda 11.8 설치
2.1 https://developer.nvidia.com/cuda-toolkit-archive 에서 필요한 버전으로 설치
내 환경과 맞는 설정 클릭 클릭
2.2 아래 코드 실행
CUDA 11.7 설치 경우
wget https://developer.download.nvidia.com/compute/cuda/11.7.1/local_installers/cuda_11.7.1_515.65.01_linux.run
sudo sh cuda_11.7.1_515.65.01_linux.run
CUDA 11.8 설치 경우
wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run
sudo sh cuda_11.8.0_520.61.05_linux.run
*Note*
기존에 11.7로 설치했지만 torchaudio와 호환 문제 때문에 cuda 11.8 버전으로 변경 (04월25일)
아래 진행 과정은 쿠다 버전과 상관없기 때문에 그대로 진행해도 무방하다
2.3 아래 화면이 뜨면 순차적으로 진행
*NOTE*
이미 호환되는 driver 확인 후 설치하였으니 여기서 driver는 해제하고 설치한다
설치가 완료되면 아래처럼 뜬다
여기서 뜨는 WARNING은 graphic driver를 같이 설치하지 않아서 뜨는 것
때문에 호환되는 드라이버를 설치하였다면 무시해도 무방하다
2.4 설치 후 경로 설정을 해줘야 진짜 끝난다
sudo nano ~/.bashrc
제일 아래에 두 줄 추가
(cuda-11.7로 경로설정 해줘도 되지만 cuda 버전 여러 개 설치할 가능성도 있기에 cuda로 했다)
export PATH="/usr/local/cuda/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda/lib64:$LD_LIBRARY_PATH"
수정된 bashrc 적용
source ~/.bashrc
2.5 명령어 입력 시 제대로 출력되면 성공
nvcc -V
3. cuDNN 설치
3.1 https://developer.nvidia.com/rdp/cudnn-archive 로 이동 후 로그인 및 동의하고 버전에 맞는 cuDNN 다운로드
나의 경우 CUDA 11.7을 설치했기 때문에 11.x 리눅스용으로 다운로드
3.2 tar.xz로 압축된 파일을 풀어준다 (tar -xvf 뒤에 풀고자 하는 파일명 기입)
tar로 압축하고 xz로 한번 더 압축 한 것 같은데 그 이유는 xz는 효율은 좋으나 한 개의 파일만 압축 할 수 있어서 tar로 먼저 묶어주고 xz로 압축한 것 같다.
tar -xvf cudnn-linux-x86_64-8.8.1.3_cuda11-archive.tar.xz
3.3 압축 풀린 파일들을 /ur/local/로 복붙 및 권한 설정
sudo cp cudnn-linux-x86_64-8.8.1.3_cuda11-archive/include/cudnn*.h /usr/local/cuda/include
sudo cp cudnn-linux-x86_64-8.8.1.3_cuda11-archive/lib/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
3.4 명령어 입력 시 제대로 출력되면 성공
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
'Dev' 카테고리의 다른 글
[Linux] Ubuntu 22.04 사용자 이름(username) 변경하기 (3) | 2023.04.20 |
---|---|
[Linux] 타임 존 (time zone) 변경 방법 (0) | 2023.04.20 |
[Linux] Ubuntu 22.04 LVM 기반 디스크 볼륨 확장 (4) | 2023.04.20 |
[git] remote git 최초 설정 (0) | 2023.04.19 |
[개발환경] RTX 4090 Ubuntu 22.04 딥러닝 학습 서버 환경 구축 (2) (3) | 2023.04.19 |