人工智能第二课 机器学习 Orange 开源项目

时间:2024-03-12 16:20:02

第一天先在整体上对Orange有个大概的了解,目前我的看法是Orange是做数据挖掘和机器学习开发的框架平台,它本身应该已经包含了好多数据挖掘和分析的算法。

本文暂时用来保存学习资料, 源代码已经下载到本地,明天开始安装学习。

Orange 是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了 Python以进行脚本开发。它包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。

以下内容摘自博客 https://my.oschina.net/u/2306127/blog/548833  。

摘要: Orange是一个基于组件的数据挖掘和机器学习软件,可以基于Qt的图形界面进行可视化流程设计。Orange基于Python进行操作,外围资源应该是相当丰富的,安装使用很简单,功能相当的强大,强烈推荐。这里介绍其安装和源代码的使用方法。

Orange(http://orange.biolab.si/)是一个基于组件的数据挖掘和机器学习软件套装,支持Python进行脚本开发。Orange由斯洛文尼亚大学计算与信息学系的生物信息实验室BioLab进行开发,https://github.com/biolab 是一个实际应用的项目而不仅仅是技术工程,包含了该组织托管的相关开源工程。

这里有不少关于数据挖掘和分析的文章(英文的,有时间了慢慢翻译一些):http://blog.biolab.si/

Orange操作简单,但功能很强大,可以使用Python强大的扩展库资源。具有快速而又多功能的可视化编程前端,以便浏览数据分析和可视化。

Orange包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目、过渡、建模、模式评估和勘探的功能。其由C++ 和 Python开发,它的图形库是由跨平台的Qt框架构建的,可以可视化地进行操作。

安装完毕,启动:

source orange3env/bin/activate
python -m Orange.canvas

源代码托管在:

https://github.com/biolab/orange3

https://github.com/biolab/orange-bio

在Ubuntu上使用这个脚本进行安装:http://biolab.github.io/install-orange/setup-ubuntu.sh

原始文件需要更新,这个是更新后的:

#!/bin/bash

p=$PWD
sudo apt-get update
sudo apt-get -y install git python-pip python-virtualenv python3-dev 
python3-numpy python3-scipy python3-pyqt4 python-qt4-dev python3-sip-dev libqt4-dev

virtualenv -p python3 --system-site-packages orange3env
source orange3env/bin/activate

echo "/usr/lib/python3/dist-packages/" > "orange3env/lib/python3.4/site-packages/0.pth"
pip install --upgrade numpy

git clone https://github.com/biolab/orange3
cd orange3
pip install -r requirements-core.txt
pip install -r requirements-dev.txt
pip install -r requirements-doc.txt
pip install -r requirements-gui.txt
pip install -r requirements-sql.txt
python setup.py develop
cd ..
git clone https://github.com/biolab/orange-bio
cd orange-bio
python setup.py develop

 

下载其它的相关工程源代码:

#!/bin/bash

source orange3env/bin/activate

git clone https://github.com/biolab/orange3-text.git
git clone https://github.com/biolab/orange3-associate.git
git clone https://github.com/biolab/orange3-network.git
git clone https://github.com/biolab/orange-web.git
git clone https://github.com/biolab/ipynb.git
git clone https://github.com/biolab/orange3-datafusion.git
git clone https://github.com/biolab/orange3-example-addon.git
git clone https://github.com/biolab/datafusion-installation-guide.git
git clone https://github.com/biolab/data-mining-course-unipv.git
git clone https://github.com/biolab/qt-graph-helpers.git