目錄
- 前言
- 1 安裝nvidia顯卡驅動
- 2 安裝docker
- 3 Docker 修改容器默認存盤位置
- 4 安裝docker compose
- 5 安裝nvidia-docker
- 6 下載 nvidia CUDA 鏡像
- 7 安裝python3.8環境
- 8 安裝pytorch1.8
- 9 提交容器成為新鏡像
- 常用命令附錄
前言
一次部署,無限安裝😊
1 安裝nvidia顯卡驅動
參考2.2更新驅動:https://blog.csdn.net/weixin_50008473/article/details/115250986
2 安裝docker
詳細參考docker官方檔案:https://docs.docker.com/engine/install/ubuntu/
sudo apt install docker.io
重啟Docker服務
sudo systemctl daemon-reload
sudo systemctl restart docker
3 Docker 修改容器默認存盤位置
(1)docker info
Docker Root Dir:/var/lib/docker 是鏡像和容器默認存盤位置
(2)vim /etc/docker/daemon.json(若沒有則創建)
(3)添加以下內容:
{
"graph":"/data/docker" # 想要修改的存盤路徑
}
(4)重啟docker: systemctl restart docker
(5)再次查看,確定修改位置正確:docker info
4 安裝docker compose
可以啟動多個容器并建立連接,
(1) 下載對應安裝包:
sudo curl -L \
"https://github.com/docker/compose/releases/download/1.27.4/docker-compose-$(uname -s)-$(uname -m)" \
-o /usr/local/bin/docker-compose
(2)賦予可執行權限:
sudo chmod +x /usr/local/bin/docker-compose
測驗:sudo docker-compose --version
結果如下圖所示:
5 安裝nvidia-docker
Docker只能使用CPU 的資源,需要連接Docker 和宿主機的顯卡驅動 —— nvidia-docker
(1)設定穩定版的存盤庫和GPG密鑰:
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
&& curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - \
&& curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
(2)更新:sudo apt-get update
(3)安裝:sudo apt-get install -y nvidia-docker2
(4)重啟docker:sudo systemctl restart docker
測驗:sudo docker run --rm --gpus all nvidia/cuda:11.1-base nvidia-smi
6 下載 nvidia CUDA 鏡像
1.sudo vim /etc/docker/daemon.json
2.加入鏡像源地址:
添加"registry-mirrors": [https://docker.mirrors.ustc.edu.cn]
如下圖所示:

注:Docker中國區官方鏡像:https://registry.docker-cn.com
3.重啟docker:systemctl restart docker.service
4.Nvidia docker cuda 官方鏡像:https://hub.docker.com/r/nvidia/cuda
5.選擇需要的 CUDA版本和cuDNN版本,這里選擇了 11.1-cudnn8-devel-ubuntu18.04::

6.再點擊 Tags 并根據剛剛選好的名字進行搜索:

7.下載鏡像:sudo docker pull nvidia/cuda:11.1-cudnn8-devel-ubuntu18.04
8.查看到下載好的鏡像:sudo docker images
9.運行docker鏡像
sudo docker run -it --name algorithm -v /data/algorithm:/data/algorithm --runtime=nvidia -e NVIDIA_VISIBLE_DEVICE=all nvidia/cuda:11.1-cudnn8-devel-ubuntu18.04
其中:algorithm為自定義容器名;/data/algorithm:/data/algorithm為專案絕對路徑:容器內專案路徑;nvidia/cuda:11.1-cudnn8-devel-ubuntu18.04為鏡像名稱,
(1)測驗顯卡驅動:nvdia-smi

(2)測驗 CUDA: nvcc -V

(3)測驗 CUDNN:ll /usr/lib/x86_64-linux-gnu/ | grep cudnn

7 安裝python3.8環境
1.準備:
(1)sudo apt-get install libffi-dev
(2)make clean && make && make install
2.下載:
(1)下載地址:https://www.python.org/ftp/python/3.8.9/Python-3.8.9.tgz
(2)cd 下載路徑
(3)解壓:tar -xzvf Python-3.8.9.tgz
(4)cd Python-3.8.9
3.安裝:
./configure prefix=/usr/local/python3 # 指定安裝的目錄
make && make install # 編譯,安裝
4.添加python3和pip3的軟鏈接:
ln -s /usr/local/python3/bin/python3 /usr/bin/python
ln -s /usr/local/python3/bin/pip3 /usr/bin/pip
8 安裝pytorch1.8
(1)如果下載慢或者超時,設定源(此處為清華源)
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
(2)若出現:subprocess.CalledProcessError: Command ‘(‘lsb_release’, ‘-a’)’ returned non-zero exit status 1.
解決方法:
find / -name lsb_release
rm -rf /usr/bin/lsb_release
(3)安裝torch1.8.0與torchvision0.9.0
pip install torch==1.8.0+cu111 torchvision==0.9.0+cu111 -f https://download.pytorch.org/whl/torch_stable.html
(4)安裝 torchaudio
pip install torchaudio==0.8.0 -i https://pypi.tuna.tsinghua.edu.cn/simple some-package
9 提交容器成為新鏡像
docker commit -m "提交的描述資訊" -a "作者" 容器ID 要創建的目標鏡像名稱:[標簽名]
sudo docker commit -m “v5” -a “double_ww” 0937721faf46 yolov5:1.0
如下圖所示:

常用命令附錄
啟動/停止容器:docker start/stop container
進入容器:docker exec -it container bash
退出并停止容器:exit
只退出容器,不停止容器:Ctrl+p+q
拷貝檔案至容器:sudo docker cp 檔案路徑 container:容器路徑
洗掉容器:docker rm container
查找鏡像:docker search images
下載鏡像:docker pull images
洗掉鏡像:docker rmi images
列出本地所有的鏡像:docker images -a
列出當前所有正在運行的容器:docker ps
列出所有的容器:docker ps -a
強制停止容器:docker kill container
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/292603.html
標籤:其他
