深度学习环境搭建(Ubuntu16.04+GTX1080Ti+CUDA8.0+Cudnn6.0+TensorFlow+Caffe2(Pytorch))

时间:2021-10-15 19:19:54

OS System:Ubuntu16.04

GPU Device:GTX1080Ti

Softwares:CUDA8.0、Cudnn6.0、TensorFlow(1.4.0)、Caffe2(1.0.0)


一、win10下安装Ubuntu16.04(双系统)

1、Linux分区方案

(Lagency+MBR)
/boot 512M
swap 16GB(本机物理内存为32GB)
/ 30GB or 35GB
/home 余下的(越多越好) (UEFI+GPT)
efi 512M
swap 16GB(本机物理内存为32GB)
/ 30GB or 35GB
/home 余下的(越多越好) swap大小设置参考:
4GB of RAM requires a minimum of 2GB of swap space
4GB to 16GB RAM requires a minimum of 4GB of swap space
16GB to 64GB of RAM requires a minimum of 8GB of swap space
64GB to 256GB of RAM requires a minimum of 16GB of swap space

2、系统引导

Lagency+MBR:win10下使用EasyBCD添加Ubuntu引导(Grub2)

UEFI+GPT:开机按快捷键选择BOOT Menu;使用Ubuntu的Grub引导;win10下使用rEFInd引导多系统

* win10下使用rEFInd步骤:

1. 官网下载zip包

2. 打开管理员命令行

3. 输入 mountvol x: /s (挂载ESP分区到x盘)

4. 把压缩包内refind文件夹复制到 x:\EFI 目录下

5. 把x:\EFI\refind\refind.conf-sample重命名为refind.conf

6. 命令行输入 bcdedit /set {bootmgr} path \EFI\refind\refind_x64.efi

7. 重启电脑

ref: https://blog.csdn.net/qf0129/article/details/78143749

二、显卡驱动、CUDA及Cudnn安装

1、安装GTX1080Ti显卡驱动

0)到NVIDIA官网查询适配的显卡驱动版本信息或下载

1)禁用自带显卡驱动nouveau

sudo gedit /etc/modprobe.d/blacklist.conf
add in the last line: blacklist nouveau
sudo update-initranfs –u
reboot
lsmod | grep nouveau //make sure nouveau is disabled, nothing will be printed out

2)run文件安装 或 命令行安装

#1 run文件安装

sudo apt-get remove --purge nvidia-*
cd Downloads
sudo service lightdm stop
ctrl + alt + f1, login by name and passwd
sudo chmod a+x NVIDIA-Linux-x86_64-375.26.run
sudo ./NVIDIA-Linux-x86_64-375.26.run --no-x-check --no-nouveau-check --no-opengl-files
//
–no-opengl-files 只安装驱动文件,不安装OpenGL文件,不加会导致循环登录
–no-check 安装驱动时不检查X服务,可省略
–no-nouveau-check 安装驱动时不检查nouveau,可省略
sudo service lightdm start

#2 命令行安装(推荐)

sudo apt-get remove --purge nvidia-*
sudo service lightdm stop
ctrl + alt + f1, login by name and passwd
sudo add-apt-repository ppa:graphics-drivers
sudo apt-get update
sudo apt-get install nvidia-375
sudo service lightdm start

2、安装CUDA8.0及Cudnn6.0

ref: https://www.cnblogs.com/wmxfd/p/installation_of_nvidia_graphics_driver_and_cuda8_and_cudnn6.html

三、TensorFlow安装

1、使用virtualenv虚拟环境安装,避免影响系统自带Python环境,使用Python3

/home目录下:
sudo apt update
sudo apt install python3-dev python3-pip
sudo pip3 install -U virtualenv # system-wide install
virtualenv --system-site-packages -p python3 ./venv_tf_p3
source ./venv_tf_p3/bin/activate
pip install --upgrade pip
pip install tensorflow-gpu==1.4
python -c "import tensorflow as tf; print(tf.__version__)" //for test
# pip安装速度慢时需要修改pip源
在home/用户名/目录下创建.pip文件夹
cd .pip
创建pip.conf文件,并输入以下内容:
[global]
timeout = 6000
index-url = http://mirrors.aliyun.com/pypi/simple/
trusted-host = mirrors.aliyun.com

2、安装jupyter notebook并添加virtualenv运行环境

source ./venv_tf_p3/bin/activate
1、安装jupyter notebook
pip install jupyter
pip install ipykernel
2、为jupyter添加kernel
python -m ipykernel install --user --name=venv_tf_p3
3、运行
jupyter notebook

四、Caffe2安装

1、使用virtualenv虚拟环境安装,避免影响系统自带Python环境,使用Python2

/home目录下:
sudo apt update
sudo apt install python-dev python-pip
sudo pip install –U virtualenv # system-wide install //安装依赖
sudo apt-get install -y --no-install-recommends \
build-essential \
git \
libgoogle-glog-dev \
libgtest-dev \
libiomp-dev \
libleveldb-dev \
liblmdb-dev \
libopencv-dev \
libopenmpi-dev \
libsnappy-dev \
libprotobuf-dev \
openmpi-bin \
openmpi-doc \
protobuf-compiler
sudo apt-get install -y --no-install-recommends \
libgflags-dev \
cmake sudo apt install graphviz python-tk virtualenv --system-site-packages -p python2.7 ./venv_cf_p2
source ./venv_cf_p2/bin/activate
pip install --upgrade pip //安装依赖
pip install --user \
future \
numpy \
protobuf \
typing \
hypothesis \
pyyaml \
pydot
//可选库安装
pip install --user \
flask \
requests \
scikit-image \
scipy \
tornado
pip install --user matplotlib==2.0.2 //这里需装旧版本的matplotlib,否则在导入matplotlib时出现 :ImportError: No module named functools_lru_cache git clone https://github.com/pytorch/pytorch.git && cd pytorch
git submodule update --init --recursive
export USE_LMDB=1 //声明环境变量,编译LMDB,MNIST例程用到
export USE_OPENCV=1 //声明环境变量,编译OpenCV
python setup.py install //环境变量设置
export PYTHONPATH=/usr/local:$PYTHONPATH
export PYTHONPATH=$home/pytorch/build:$PYTHONPATH //change $home to you home path, such as "/home/john"
export LD_LIBRARY_PATH=/usr/local/lib:$LD_LIBRARY_PATH
add in ~/.bashrc
source ~/.bashrc //测试是否安装成功
cd ~ && python -c 'from caffe2.python import core' 2>/dev/null && echo "Success" || echo "Failure"
终端输出Success即可

[ 在pytorch目录下运行另一个测试命令:python caffe2/python/operator_test/activation_ops_test.py,没有输出期望结果,但对实际的GPU调用没有影响 ]

深度学习环境搭建(Ubuntu16.04+GTX1080Ti+CUDA8.0+Cudnn6.0+TensorFlow+Caffe2(Pytorch))

2、安装jupyter notebook并添加virtualenv运行环境

[ 若按照(三、2、)方法安装会出现以下错误,估计是jupyter对Python2的兼容问题 ]

深度学习环境搭建(Ubuntu16.04+GTX1080Ti+CUDA8.0+Cudnn6.0+TensorFlow+Caffe2(Pytorch))

[ 解决:直接指定版本安装 ]

source ./venv_cf_p2/bin/activate
1、安装jupyter notebook
pip install jupyter-console==5.2.0 jupyter-client==5.2.1 jupyter-core==4.4.0 jupyter==1.0.0 ipython==5.2.0 ipykernel==4.10.0
2、为jupyter添加kernel
python -m ipykernel install --user --name=venv_cf_p2
3、运行
jupyter notebook

参考:

Caffe2官方:https://caffe2.ai/docs/getting-started.html?platform=ubuntu&configuration=compile

更新时间:

2018/10/23

深度学习环境搭建(Ubuntu16.04+GTX1080Ti+CUDA8.0+Cudnn6.0+TensorFlow+Caffe2(Pytorch))的更多相关文章

  1. 深度学习环境配置Ubuntu16.04+CUDA8.0+CUDNN5

    深度学习从12年开始打响,配置深度学习环境软件一直是一个头疼的问题,如何安装显卡驱动,如何安装CUDA,如何安装CUDNN:Ubuntu官方一直吐槽Nvidia显卡驱动有问题,网上大神也给出了关闭li ...

  2. 深度学习环境配置:Ubuntu16.04安装GTX1080Ti+CUDA9.0+cuDNN7.0完整安装教程(多链接多参考文章)

    本来就对Linux不熟悉,经过几天惨痛的教训,参考了不知道多少篇文章,终于把环境装好了,每篇文章或多或少都有一些用,但没有一篇完整的能解决我安装过程碰到的问题,所以决定还是自己写一篇我安装过程的教程, ...

  3. 深度学习环境配置:Ubuntu16.04下安装GTX1080Ti+CUDA9.0+cuDNN7.0完整安装教程(多链接多参考文章)

    本来就对Linux不熟悉,经过几天惨痛的教训,参考了不知道多少篇文章,终于把环境装好了,每篇文章或多或少都有一些用,但没有一篇完整的能解决我安装过程碰到的问题,所以决定还是自己写一篇我安装过程的教程, ...

  4. 保姆级教程——Ubuntu16.04 Server下深度学习环境搭建:安装CUDA8.0,cuDNN6.0,Bazel0.5.4,源码编译安装TensorFlow1.4.0(GPU版)

    写在前面 本文叙述了在Ubuntu16.04 Server下安装CUDA8.0,cuDNN6.0以及源码编译安装TensorFlow1.4.0(GPU版)的亲身经历,包括遇到的问题及解决办法,也有一些 ...

  5. 深度学习环境搭建:Tensorflow1.4.0+Ubuntu16.04+Python3.5+Cuda8.0+Cudnn6.0

    目录 深度学习环境搭建:Tensorflow1.4.0+Ubuntu16.04+Python3.5+Cuda8.0+Cudnn6.0 Reference 硬件说明: 软件准备: 1. 安装Ubuntu ...

  6. 阿里云ECS服务器环境搭建——ubuntu16.04图形界面的安装

    阿里云ECS服务器环境搭建——ubuntu16.04图形界面的安装 最近琢磨着想在服务器上搭建一个hexo博客,于是就在阿里云上买了一个云服务器ECS,远程接入后默认给的是一个命令窗口,没有图形界面, ...

  7. linux系统下深度学习环境搭建和使用

    作为一个AI工程师,对Linux的一些技能的掌握也能从一定层面反应工程师的资深水平. 要求1:基于SSH的远程访问(本篇文章) 能用一台笔记本电脑,远程登陆一台linux服务器 能随时使用笔记本电脑启 ...

  8. Ubuntu深度学习环境搭建 tensorflow+pytorch

    目前电脑配置:Ubuntu 16.04 + GTX1080显卡 配置深度学习环境,利用清华源安装一个miniconda环境是非常好的选择.尤其是今天发现conda install -c menpo o ...

  9. [AI开发]centOS7.5上基于keras/tensorflow深度学习环境搭建

    这篇文章详细介绍在centOS7.5上搭建基于keras/tensorflow的深度学习环境,该环境可用于实际生产.本人现在非常熟练linux(Ubuntu/centOS/openSUSE).wind ...

  10. Win10+RTX2080深度学习环境搭建:tensorflow、mxnet、pytorch、caffe

    目录 准备工作 设置conda国内镜像源 conda 深度学习环境 tensorflow.mxnet.pytorch安装 tensorflow mxnet pytorch Caffe安装 配置文件修改 ...

随机推荐

  1. Mysql 中 show full processlist

    processlist命令的输出结果显示了有哪些线程在运行,可以帮助识别出有问题的查询语句,两种方式使用这个命令. 1. 进入MySQL/bin目录下输入mysqladmin processlist; ...

  2. hdu2222 Keywords Search ac自动机

    地址:http://acm.split.hdu.edu.cn/showproblem.php?pid=2222 题目: Keywords Search Time Limit: 2000/1000 MS ...

  3. 从Evernote迁移到Wiz

    实在受不了evernote没完没了的弹出广告和让升级账号,我不过就是想安安静静的记个笔记,真不想看您的广告好吧.于是无奈这下,只能选择转换到别的笔记工具阵营. 由于以前一直听说OneNote是仅次于E ...

  4. 在RHEL5.4下安装ORACLE11G

    以root身份登录到系统,新增组和用户: #groupadd oinstall #groupadd dba #useradd -g oinstall -G dba oracle #passwd ora ...

  5. Mac 上Dock中添加“最近打开过的项目”(Recent Applications)

    有一个特别有用的Stack,“最近打开过的项目”,建立方法如下: 1. 打开Terminal,输入以下命令 defaults write com.apple.dock persistent-other ...

  6. 谈谈python中的 lambda

    最近刚开始学习python,然后要加几个python的群去学习学习,但是呢有个群的申请栏要求写一个用lambda求1-100的和.....然后悲剧的就是不会啊....然后就没有然后了... 所以去网上 ...

  7. [置顶] 【Git入门之十】Rebase操作

    原创作品,转载请标明:http://blog.csdn.net/jackystudio/article/details/12309627 Rebase,衍合?变基?唉,我也不知道要怎么翻译合适...变 ...

  8. mysql 服务不见了的解决办法

    昨天打开电脑mysql突然连接不了了,去服务里找,却找不到mysql服务了 解决:5.0版本:开始->运行->cmd,进到mysql安装的bin目录D:\MySQL\bin>mysq ...

  9. oracle--dba和表的备份与恢复

    数据库管理员 每个oracle数据库应该至少有一名数据库管理员(dba),对于一个小的数据库,一个dba就够了,但是对于一个大的数据库可能需要多个dba分别担负不同的管理职责,那么一个数据库管理员的主 ...

  10. ASP.NET 页面执行顺序

    1.对象初始化(Onlnit方法) 页面中的控件(包括页面本身)都是在它们最初的form中被首次初始化的,通过在aspx页面的后台代码文件的构造器中声明你的对象,页面将知道对象的类型,并知道需要创建多 ...