在租用某大厂服务器时,输入nvcc -V显示nvcc没有安装,但是服务器确实是装了cuda和cudnn的,于是输入vim ~/.bashrc在行末尾加上:
1 | export PATH=$PATH:/usr/local/cuda/bin |
然后执行source ~/.bashrc,之后nvcc -V成功输出信息。
以为终于可以成功用上tensorflow-gpu版了,写了个简单的test.py测试一下,结果输出结果还是在cpu上跑的。我就很无语了,cuda啥的都装上了,tensorflow-gpu也装成功,为啥还是使用的cpu。接着输入nvidia-smi查看显卡,出现“NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver”……
谷歌之后发现解决方案:
输入命令:
1 | sudo apt-get install dkms |
查看nvidia版本号
1 | ls /usr/src/ |
发现服务器的nvidia版本号为440.36,于是输入命令:
1 | sudo dkms build -m nvidia -v 440.36 |
输入nvidia-smi能显示显卡信息,此时也能成功使用gpu了。