登录后死机, 关机时死机的解决方法
更新内核并安装 Nvidia 显卡驱动可解决.
在内核更新为 4.15.18,Nvidia 显卡驱动为 390 时, 问题解决.
使用 LiveCD 启动, 然后 chroot 到安装的系统的根分区. 然后
sudo systemctl set-default multi-user.target
使系统启动后默认进入字符界面, 从而避免登录后进入图形界面时死机.
进入字符界面登录后按照以下方式更新内核并安装 Nvidia 显卡驱动.
更新内核
内核下载地址 http://kernel.ubuntu.com/~kernel-ppa/mainline
- uname -sr #查看当前内核版本
- wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.15.18/linux-headers-4.15.18-041518_4.15.18-041518.201804190330_all.deb
- wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.15.18/linux-headers-4.15.18-041518-generic_4.15.18-041518.201804190330_amd64.deb
- wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.15.18/linux-image-4.15.18-041518-generic_4.15.18-041518.201804190330_amd64.deb
- sudo dpkg -i *.deb
- sudo reboot
安装 Nvidia 显卡驱动
- sudo add-apt-repository ppa:graphics-drivers/ppa
- sudo apt-cache search nvidia | less #查看并寻找合适的显卡驱动版本
- sudo apt install nvidia-384 nvidia-prime
- sudo systemctl set-default graphical.target
- sudo reboot
更改回默认图形界面登录, 重启看是否解决了登录及关机时死机的问题.
安装 CUDA,cuDNN,Tensorflow 等
CUDA9.0 + cuDNN7.0 + tensorflow-gpu 1.8.0
以下参考
如何评价 Ubuntu 18.04 LTS ? - 张凡的回答 - 知乎 https://www.zhihu.com/question/268165660/answer/376948393
Installation_Guide 文档
安装 CUDA
- sudo systemctl set-default multi-user.target #安装 CUDA 时必须确保没有 Nouveau 驱动或 Nvidia 驱动运行, 故需停用图形界面.
- sudo reboot
降低 gcc,g++ 版本为 gcc-5,g++-5
- sudo apt install gcc-5 g++-5
- sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 50
- gcc --version
- sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 50
- g++ --version
- ./cuda_9.0.176_384.81_linux.run
- sudo ./cuda_9.0.176.1_linux.run
- sudo ./cuda_9.0.176.2_linux.run
安装时会询问安装选项. 因为是双显卡, 所以不要安装 OpenGL, 显卡驱动已安装过, 也不再安装.
安装完成后, 记得添加到 PATH.
sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev
安装 cuDNN
- sudo cp cuda/include/cudnn.h /usr/local/cuda/include
- sudo cp cuda/lib64/libcudnn*/usr/local/cuda/lib64
- sudo chmod a+r /usr/local/cuda/include/cudnn.h
- sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
- sudo apt-get install libfreeimage3 libfreeimage-dev
安装 Anaconda
- chmod +x Anaconda3-5.1.0-Linux-x86_64.sh
- ./Anaconda3-5.1.0-Linux-x86_64.sh
安装 Tensorflow
pip install tensorflow-gpu
一些可能用到的命令
nvidia-smi
lsmod | grep nouveau
sudo restore -i -f homexuewei.bak .
END
2018.5.1
来源: http://www.bubuko.com/infodetail-2582801.html