Ubuntu k80深度学习环境搭建

Alt text

Description

本文讲述深度学习环境的配置,K80的配置,解决Linux下有界面的无线循环问题!

英伟达驱动安装

  1. 英伟达驱动下载:https://www.nvidia.cn/Download/driverResults.aspx/135493/cn/
  2. 由于是驱动的冲突,那么自然是要杀掉和显卡结合不是那么紧密的草根板驱动nouveau了,加入黑名单是我们要做的第一件事,这样启动以后就不会默认使用草根驱动;
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    cd /etc/modprobe.d/
    # 文件夹下创建
    touch blacklist-nouveau.conf
    vim blacklist-nouveau.conf
    blacklist-nouveau.conf 中加入黑名单
    blacklist nouveau
    options nouveau modeset=0
    # 更新的blacklist
    update initramfs -u命令得到
    # 重启系统,强力保证blacklist生效
    reboot
    # 查看是否vouveau真的被禁止掉了,如果没有任何内容出现,那么草根驱动被禁止掉了
    lsmod | grep nouveau

下载NVIDIA官方的K80显卡驱动,一般驱动都是通过deb包进行安装,但是安装后会加入OpenGL的驱动,所以必须得使用.run的文件,.run文件下载地址:https://www.nvidia.cn/Download/driverResults.aspx/135493/cn/

如果不用.run方式的话,那么就会进入Linux的无限循环界面。

1
./XXX-NVIDIA.run --no-opengl-files

(重要的事情说三遍,这里面的-和字母之间没有空格、这里面的-和字母之间没有空格、这里面的‘-’和字母之间没有空格)

出现蓝色的背景界面,如果出现了(X server is running的现象,要注意用户态输入sudo service lightdm stop关闭桌面管理器 ),然后accept协议,接着出现the distribution provided pre-install scripts failed的提示,忽视它,然后继续安装下去,一路OK然后reboot系统,最终得到完整的gnome桌面系统。

1
sudo service lightdm stop

检验是否安装成功,在命令行界面下输入 nvidia-smi检验是否安装成功

1
nvidia-smi

安装源管理软件包Anaconda:

下载地址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.sh/

Cuda安装:

  1. 下载CUDA
    https://developer.nvidia.com/cuda-downloads/

  2. 安装cuda

    1
    2
    3
    sudo dpkg -i cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64.deb
    sudo apt update
    sudo apt -y install cuda
  3. 将CUDA路径添加至环境变量在终端输入

    1
    sudo gedit /etc/profile

在profile文件中添加:

1
2
3
export CUDA_HOME=/usr/local/cuda-8.0
export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

source /etc/profile即可

1
source /etc/profile
  1. 验证安装成功:
    1
    nvcc -V

会得到相应的nvcc编译器相应的信息,那么CUDA配置成功了。(记得重启系统)

  1. 如果要进行cuda性能测试,可以进行:
    1
    2
    cd /usr/local/cuda/samples
    sudo make -j8

编译完成后,可以进samples/bin/…/…/…的底层目录,运行各类实例。

安装tensorflow

  1. 官方连接:https://www.tensorflow.org/install/install_linux/
  2. 参考官方文档的pip源部分:
    官方文档的pip源部分]
  3. pip安装的时候千万注意:
    sudo pip3 install –upgrade 后面的接的gpu版本的连接,在官网文档最后面,python务必与对应的tensorflow版本对应。
    官方文档的pip源部分

安装完后也要注意依赖库版本的修复,因为开源代码,版本库版本特别多,所以如果有版本不兼容,那么一定要进行修复,如何修复自行百度。

  1. tensorflow验证:
    1
    2
    3
    4
    import tensorflow as tf
    hello = tf.constant('Hello, TensorFlow!')
    sess = tf.Session()
    print(sess.run(hello))

安装keras:

  1. 安装keras:

    1
    sudo pip install -U --pre keras
  2. 安装完毕后,输入python,然后输入:

    1
    2
    3
     import tensorflow

     import keras
  3. Keras中mnist数据集测试

    1
    2
    3
    git clone https://github.com/fchollet/keras.git
    cd keras/examples/
    python mnist_mlp.py

程序无错进行,至此,keras安装完成。