Ubuntu系统下创建python数据挖掘虚拟环境

时间:2021-04-02 21:15:50

Ubuntu系统下创建python数据挖掘虚拟环境

虚拟环境:
 
虚拟环境是用于创建独立的python环境,允许我们使用不同的python模块和版本,而不混淆。
 
让我们了解一下产品研发过程中虚拟环境的必要性,在python项目中,显然经常要使用不同的python库(包装器)来完成工作,但结局并不总是圆满的,大部分时候,我们会面临着诸如python应用无法在新的机器(操作系统)上运行的环境问题,这是新机器上Python库的依赖问题导致的。为了更好的理解,设想在开发python应用的过程当中,我们使用了python pandas(python的数据分析库)0.18.0版本中的函数,而这个函数在新机器安装的0.17.1的python pandas库里没有,由于版本差异,python应用就无法在新机器上运行。
 
要解决这个问题,我们需要使用一个包含了项目所需的所有东西的python环境,从而可以有序独立地运行。
 
python项目开发,不管你要忙于多少个项目,使用虚拟环境都是非常推荐的一种方式。
 
在Ubuntu系统下,创建虚拟环境相当简单,使用virtualenv就可以了(一个创建独立python环境的工具)。
 
关于virtualenv:
Ubuntu系统下创建python数据挖掘虚拟环境
Ubuntu系统下创建python数据挖掘虚拟环境
virtualenv通过创建隔离的环境解决项目的依赖冲突问题,这些隔离的环境包括python开发者项目所需的所有工具。用这个工具创建的虚拟环境包括新的python二进制文件,其实是整个python标准库的拷贝。
 
安装virtualenv:
$ sudo pip install virtualenv
 
现在我们已经成功安装了virtualenv,现在我们创建一个文件夹(环境),我们将安装python数据挖掘包。
 
创建虚拟环境:
$ virtualenv dataaspirant_venv
在当前路径下会创建一个文件夹,包含了python的可执行文件和pip库,便于你安装其他包。虚拟环境的名称可以是任何名称,在这个例子中,名为dataaspirant_venv,省略名称的话,文件就会默认放在当前目录。
 
这将创建一个在任何路径下都可以命令运行的python拷贝,只不过是把它放在了一个名为dataaspirant_venv的文件夹里。
 
使用虚拟环境
要使用虚拟环境,执行以下命令:
$ source dataaspirant_venv/bin/activate

当前虚拟环境的名称会出现在命令行提示符的左边,让你知道当前的虚拟环境是哪个,从现在开始,你用pip安装的任何包都被放进dataaspriant_env文件夹,和全局的python安装是隔离的。

 
python数据挖掘包安装
开始安装python数据挖掘包了
 
安装numpy
$ pip install numpy
 
安装scipy
$ pip install scipy
 
安装matplotlib
$ pip install matplotlib
安装ipython
$ pip install ipython[all]
安装pandas
$ pip install pandas
安装Statsmodel
$ pip install statsmodel
安装scikit-learn
$ pip install scikit-learn
运行脚本文件
当虚拟环境是使用状态时,你只需要到你的script文件所在路径下,运行即可。
$ python script_file.py
停用虚拟环境
如果你不再需要虚拟环境,可以停用。
 
$ deaactivate

接着你就会回到系统默认的python环境。

要删除一个虚拟环境,只需要删除文件夹,本例中使用rm -rf dataaspriant_env即可。
 
参考:
 
关注我们:

FACEBOOK| QUORA |TWITTER| REDDIT | FLIPBOARD |LINKEDIN | MEDIUM| GITHUB

希望你喜欢今天的文章,如果您有任何疑问,欢迎发表评论,如果你希望我们写某个特定的主题,也可以在评论下告诉我们。
如果你想分享你的经验和建议,请联系 hello@dataaspirant.com
感谢阅读
Home|About| Data scientists Interviews |For beginners|Join us|  Monthly newsletter
 
 
这是一篇译文,原文链接为:
 
转载请注明出处,欢迎交流python技术。