• 跟我一起数据挖掘(23)——C4.5

    时间:2022-07-01 08:27:11

    C4.5简介C4.5是一系列用在机器学习和数据挖掘的分类问题中的算法。它的目标是监督学习:给定一个数据集,其中的每一个元组都能用一组属性值来描述,每一个元组属于一个互斥的类别中的某一类。C4.5的目标是通过学习,找到一个从属性值到类别的映射关系,并且这个映射能用于对新的类别未知的实体进行分类。由于I...

  • Clementine 12.0 的使用安装(数据挖掘)

    时间:2022-06-15 05:31:32

    1、下载[统计数据挖掘工具].TLF-SOFT-SPSS_Clementine_v12.0-CYGiSO.bin2、下载虚拟光驱安装软件本人使用的是DTLite4402-0131。3、如果需要汉化的话要下载一个汉化包。(汉化肯定会不太稳定,如果英语强大可以直接英文。)4、安装好虚拟光驱并打开虚拟光驱...

  • SPSS Modeler数据挖掘项目实战(数据挖掘、建模技术)

    时间:2022-06-08 20:23:34

    SPSSModeler是业界极为著名的数据挖掘软件,其前身为SPSSClementine。SPSSModeler内置丰富的数据挖掘模型,以其强大的挖掘功能和友好的操作习惯,深受用户的喜爱和好评,成为众多知名企业在数据挖掘项目上的软件产品选择。本课程以SPSSModeler为应用软件,以数据挖掘项目生...

  • 数据挖掘入门系列教程(四)之基于scikit-lean实现决策树

    时间:2022-06-08 20:23:46

    目录数据挖掘入门系列教程(四)之基于scikit-lean决策树处理Iris加载数据集数据特征训练随机森林调参工程师结尾数据挖掘入门系列教程(四)之基于scikit-lean决策树处理Iris在上一篇博客,我们介绍了决策树的一些知识。如果对决策树还不是很了解的话,建议先阅读上一篇博客,在来学习这一篇...

  • 数据挖掘入门系列教程(四点五)之Apriori算法

    时间:2022-06-08 20:23:28

    目录数据挖掘入门系列教程(四点五)之Apriori算法频繁(项集)数据的评判标准Apriori算法流程结尾数据挖掘入门系列教程(四点五)之Apriori算法Apriori(先验)算法关联规则学习的经典算法之一,用来寻找出数据集中频繁出现的数据集合。如果看过以前的博客,是不是想到了这个跟数据挖掘入门系...

  • 数据挖掘入门系列教程(二)之分类问题OneR算法

    时间:2022-06-08 20:23:52

    数据挖掘入门系列教程(二)之分类问题OneR算法数据挖掘入门系列博客:https://www.cnblogs.com/xiaohuiduan/category/1661541.html项目地址:GitHub在上一篇博客中,我们通过分析亲和性来寻找数据集中数据与数据之间的相关关系。这篇博客我们会讨论简...

  • SPSS Modeler数据挖掘:回归分析

    时间:2022-06-08 20:23:52

    SPSSModeler数据挖掘:回归分析1模型定义回归分析法是最基本的数据分析方法,回归预测就是利用回归分析方法,根据一个或一组自变量的变动情况预测与其相关的某随机变量的未来值。回归分析是研究一个变量(被解释变量)与另一个或几个变量(解释变量)的具体依赖关系的计算方法和理论。回归分析的主要内容:从一...

  • 笔记 加州理工学院公开课:机器学习与数据挖掘 一

    时间:2022-06-06 01:36:32

    对目前在看的一个公开课做一下笔记第一课的连接在这里:http://open.163.com/movie/2012/2/3/C/M8FH262HJ_M8FTVDQ3C.html这门课是caltech的机器学习的入门课程就相当于科普性质的主要想巩固一下以前学的知识尽量解释概念少贴公式本门课的讲师是Yas...

  • 大数据环境下集成R语言的数据挖掘平台项目记录(三)

    时间:2022-06-01 14:13:28

         今天开了第二次的各个比赛小组之间的交流会议,会上我说明了一下我们小组的进度,并得到了老师对我们小组进度的肯定。尽管老师认为我们的速度算快了,但是我觉得我们还是有很多问题没有解决,并没有想象的那么乐观。出现的问题主要由以下几点:                          1.对R语言...

  • 加州理工学院公开课:机器学习与数据挖掘_过拟化

    时间:2022-05-28 01:58:09

    转载自:http://blog.csdn.net/feitianhu213/article/details/40872225课程简介本节课主要介绍了关于机器学习中的过拟化问题。作者指出,区别一个专业级玩家和业余爱好者的方法之一就是他们如何处理过拟化问题。通过该课程,我们可以知道样本数据的拟合并不是越...

  • 加州理工学院公开课:机器学习与数据挖掘_过拟化(第十一课)

    时间:2022-05-28 01:58:15

    原文地址:http://blog.csdn.net/feitianhu213/article/details/40872225课程简介本节课主要介绍了关于机器学习中的过拟化问题。作者指出,区别一个专业级玩家和业余爱好者的方法之一就是他们如何处理过拟化问题。通过该课程,我们可以知道样本数据的拟合并不是...

  • 数据挖掘之聚类算法Apriori总结

    时间:2022-05-11 00:50:48

    项目中有时候需要用到对数据进行关联分析,比如分析一个小商店中顾客购买习惯.packagecom.data.algorithm;importcom.google.common.base.Splitter;importcom.google.common.collect.Lists;importcom.g...

  • kaggle数据挖掘竞赛初步--Titanic<随机森林&特征重要性>

    时间:2022-05-08 11:01:19

    完整代码: https://github.com/cindycindyhi/kaggle-Titanic特征工程系列:Titanic系列之原始数据分析和数据处理Titanic系列之数据变换Titanic系列之派生属性&维归约之前的三篇博文已经进行了一次还算完整的特征工程,分析字符串类型的变量...

  • 本培训旨在向您介绍数据挖掘方面的常见概念和做法

    时间:2022-05-01 07:32:42

    PL1936-大数据快速数据挖掘平台RapidMiner数据分析随笔配景:在很多时候,很多入门不久的伴侣城市问我:我是从其他语言转到措施开发的,有没有一些根本性的资料给我们学习学习呢,你的框架觉得一下太大了,但愿有个循序渐进的教程或者视频来学习就好了。对付学习有困难不知道如何提升本身可以加扣:122...

  • 采用机器学习方式对网站进行数据挖掘的经验指南

    时间:2022-04-19 12:40:54

    这篇文章主要介绍了采用机器学习方式对网站进行数据挖掘的经验指南,对一些优化算法有比较详细的讲解,需要的朋友可以参考下

  • 【Python数据挖掘课程】三.Kmeans聚类代码实现、作业及优化

    时间:2022-04-14 05:36:28

        这篇文章直接给出上次关于Kmeans聚类的篮球远动员数据分析案例,同时介绍这次作业同学们完成的图例,最后介绍Matplotlib包绘图的优化知识。    前文推荐:    【Python数据挖掘课程】一.安装Python及爬虫入门介绍    【Python数据挖掘课程】二.Kmeans聚类数...

  • 新浪微博数据挖掘食谱之九: 用户篇 (获取转发微博的用户名)

    时间:2022-04-02 09:33:30

    #!/usr/bin/python#-*-coding:utf-8-*-'''Createdon2015-1-5@author:beyondzhou@name:find_repost_users.py'''#Finduserswhohaverepostweibosdeffind_repost_use...

  • 新浪微博数据挖掘食谱之九: 用户篇 (获取转发微博的用户名)

    时间:2022-04-02 09:33:24

    #!/usr/bin/python#-*-coding:utf-8-*-'''Createdon2015-1-5@author:beyondzhou@name:find_repost_users.py'''#Finduserswhohaverepostweibosdeffind_repost_use...

  • SmartDo数据挖掘思路

    时间:2022-03-30 16:15:57

    SmartDo数据挖掘思路数据挖掘部分:数据挖掘的主要网址为:https://www.amazon.com/Best-Sellers/zgbs挖掘部分为网址左边的入口,大约20多个,其中页面分级如下:一级:https://www.amazon.com/Best-Sellers/zgbs二级:(Hom...

  • python适合做数据挖掘吗

    时间:2022-03-26 03:36:41

    在本篇文章里小编给各位分享的是一篇关于python做数据挖掘的相关知识点内容,有兴趣的朋友们可以学习下。