Ubuntu k80深度学习环境搭建

Description

本文讲述深度学习环境的配置，K80的配置，解决Linux下有界面的无线循环问题！

英伟达驱动安装

英伟达驱动下载：https://www.nvidia.cn/Download/driverResults.aspx/135493/cn/

由于是驱动的冲突，那么自然是要杀掉和显卡结合不是那么紧密的草根板驱动nouveau了，加入黑名单是我们要做的第一件事，这样启动以后就不会默认使用草根驱动；

cd /etc/modprobe.d/
# 文件夹下创建
touch blacklist-nouveau.conf
vim blacklist-nouveau.conf
blacklist-nouveau.conf 中加入黑名单
blacklist nouveau
options nouveau modeset=0
# 更新的blacklist
update initramfs -u命令得到
# 重启系统，强力保证blacklist生效
reboot
# 查看是否vouveau真的被禁止掉了，如果没有任何内容出现，那么草根驱动被禁止掉了
lsmod | grep nouveau

下载NVIDIA官方的K80显卡驱动，一般驱动都是通过deb包进行安装，但是安装后会加入OpenGL的驱动，所以必须得使用.run的文件，.run文件下载地址：https://www.nvidia.cn/Download/driverResults.aspx/135493/cn/

如果不用.run方式的话，那么就会进入Linux的无限循环界面。

1	./XXX-NVIDIA.run --no-opengl-files

(重要的事情说三遍，这里面的-和字母之间没有空格、这里面的-和字母之间没有空格、这里面的‘-’和字母之间没有空格)

出现蓝色的背景界面，如果出现了（X server is running的现象，要注意用户态输入sudo service lightdm stop关闭桌面管理器），然后accept协议，接着出现the distribution provided pre-install scripts failed的提示，忽视它，然后继续安装下去，一路OK然后reboot系统，最终得到完整的gnome桌面系统。

1	sudo service lightdm stop

检验是否安装成功，在命令行界面下输入 nvidia-smi检验是否安装成功

1	nvidia-smi

安装源管理软件包Anaconda：

下载地址：https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.sh/

Cuda安装：

下载CUDA
https://developer.nvidia.com/cuda-downloads/

安装cuda

1
2
3

sudo dpkg -i cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64.deb
sudo apt update
sudo apt -y install cuda

将CUDA路径添加至环境变量在终端输入
1
sudo gedit /etc/profile

在profile文件中添加：

1
2
3

export CUDA_HOME=/usr/local/cuda-8.0
export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

source /etc/profile即可

1	source /etc/profile

验证安装成功：
1
nvcc -V

会得到相应的nvcc编译器相应的信息，那么CUDA配置成功了。(记得重启系统)

如果要进行cuda性能测试，可以进行：
1
2
cd /usr/local/cuda/samples
sudo make -j8

编译完成后，可以进samples/bin/…/…/…的底层目录，运行各类实例。

安装tensorflow

官方连接：https://www.tensorflow.org/install/install_linux/
参考官方文档的pip源部分:
]
pip安装的时候千万注意：
sudo pip3 install –upgrade　后面的接的gpu版本的连接，在官网文档最后面，python务必与对应的tensorflow版本对应。

安装完后也要注意依赖库版本的修复，因为开源代码，版本库版本特别多，所以如果有版本不兼容，那么一定要进行修复，如何修复自行百度。

tensorflow验证：

import tensorflow as tf
hello = tf.constant('Hello, TensorFlow!')
sess = tf.Session()
print(sess.run(hello))

安装keras：

安装keras：
1
sudo pip install -U --pre keras
安装完毕后，输入python，然后输入：
1
2
3
import tensorflow

import keras

Keras中mnist数据集测试

1
2
3

git clone https://github.com/fchollet/keras.git
cd keras/examples/ 
python mnist_mlp.py

程序无错进行，至此，keras安装完成。

小流汇江海