后台小程序开发的全方位指南
734
2022-11-14
Pytorch GPU 训练环境搭建
之前⼀直使⽤ Tensorflow 训练模型,第⼀次训练Pytorch模型的时候,发现速度很慢,仔细观察,发现GPU 内存占⽤为0,基本没有使⽤GPU。
AssertionError: CUDA unavailable, invalid device 0 requested
测试cuda是否配置正确
import torchprint(torch.cuda.is_available())
重新安装cuda
检测本地GPU CUDA版本 nvidia-smi
pip3 install torch1.9.0+cu101 torchvision0.10.0+cu101 torchaudio=0.9.0
当前 torchvision0.10.0+cu101 版本必须是匹配的。如果版本不匹配,如上⾯的命令,则会出现错误
我们打开网站 download.pytorch.org/whl/torch_s… 查看所有版本
"cu101" 表示需要的CUDA版本
"torchvision-0.2.1" 可以看到我们可以适应的版本
其它字段信息,包含适配 python 版本,cpu 版本,或者是系统⽀持
conda install torch==1.8.1+cu101 torchvision==0.9.1+cu101torchaudio===0.8.1
如果安装还是报错的话
ERROR: Could not find a version that satisfies the requirementtorch1.8.1+cu101...
我们可以换下⾯这种安装⽅式
conda install -i torch===1.8.1torchvision===0.9.1
终于安装成功,满⼼欢⼼重新测试:
还是不对,这⼀次报错说我们的 CUDA 驱动版本太低了,⽽是 Pytorch 的版本和 CUDA 不匹配。
查看我们的 CUDA Version 为 10.0.130
再看下我们当前环境的 torch 版本
发现1.8.0版本对应的CUDA最低为10.2 版本,确实⽐我们的要训练环境要高,重新调整我们本地虚拟环境版本,我们稍微降低⼀下版本,Torch官⽹的版本只提供了CUDA 9.2和CUDA 10.1的版本,我的CUDA是10.0的。所以这里版本不对应导致Torch.cuda加速无法运行。
这⾥支持10.0版本为1.2.0版本,感觉有点低,升级⼀下CUDA版本到10.1版本
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~