• 100天搞定机器学习|Day56 随机森林工作原理及调参实战(信用卡欺诈预测)

    时间:2024-01-06 08:46:05

    本文是对100天搞定机器学习|Day33-34 随机森林的补充前文对随机森林的概念、工作原理、使用方法做了简单介绍,并提供了分类和回归的实例。本期我们重点讲一下:1、集成学习、Bagging和随机森林概念及相互关系2、随机森林参数解释及设置建议3、随机森林模型调参实战4、随机森林模型优缺点总结集成学...

  • 机器学习实战(一)kNN

    时间:2024-01-05 10:40:10

    $k$-近邻算法(kNN)的工作原理:存在一个训练样本集,样本集中的每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对于关系。输入没有标签的新数据后,将新数据的每一个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。一般来说,我们只选择样本数据集...

  • 《机器学习实战(基于scikit-learn和TensorFlow)》第五章内容学习心得

    时间:2023-12-30 18:47:42

    本章在讲支持向量机(Support Vector Machine)。支持向量机,一个功能强大的机器学习模型,能够执行线性或非线性数据的分类、回归甚至异常值检测的任务。它适用于中小型数据集的分类。线性SVM分类线性SVM分类大体分为两类,一种叫硬间隔分类,另一种叫软间隔分类。两者间的区别在于是否一定要...

  • 机器学习实战 - 读书笔记(12) - 使用FP-growth算法来高效发现频繁项集

    时间:2023-12-10 17:39:07

    [comment]: # 机器学习实战 - 读书笔记(12) - 使用FP-growth算法来高效发现频繁项集前言最近在看Peter Harrington写的“机器学习实战”,这是我的学习心得,这次是第12章 - 使用FP-growth算法来高效发现频繁项集。基本概念FP-growth算法FP-gr...

  • 吴裕雄--天生自然python机器学习实战:K-NN算法约会网站好友喜好预测以及手写数字预测分类实验

    时间:2023-11-21 23:35:56

    实验设备与软件环境硬件环境:内存ddr3 4G及以上的x86架构主机一部系统环境:windows软件环境:Anaconda2(64位),python3.5,jupyter内核版本:window10.0实验内容和原理(1)实验内容:使用k近邻算法改进约会网站的配对效果。海伦使用约会网址寻找适合自己的约...

  • 基于kNN的手写字体识别——《机器学习实战》笔记

    时间:2023-11-21 23:29:54

    看完一节《机器学习实战》,算是踏入ML的大门了吧!这里就详细讲一下一个demo:使用kNN算法实现手写字体的简单识别kNN先简单介绍一下kNN,就是所谓的K-近邻算法:【作用原理】:存在一个样本数据集合、每个样本数据都存在标签。输入没有标签的新数据后,将新数据的每个特征与样本集数据的对应特征进行比较...

  • 机器学习实战---决策树CART回归树实现

    时间:2023-11-21 23:20:29

    机器学习实战---决策树CART简介及分类树实现一:对比分类树CART回归树和CART分类树的建立算法大部分是类似的,所以这里我们只讨论CART回归树和CART分类树的建立算法不同的地方。首先,我们要明白,什么是回归树,什么是分类树。两者的区别在于样本输出:如果样本输出是离散值,那么这是一颗分类树。...

  • 机器学习实战---决策树CART简介及分类树实现

    时间:2023-11-21 23:18:05

    https://blog.csdn.net/weixin_43383558/article/details/84303339?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.n...

  • 机器学习实战之 第10章 K-Means(K-均值)聚类算法

    时间:2023-11-10 22:49:30

    第 十 章 K-Means(K-均值)聚类算法K-Means 算法聚类是一种无监督的学习, 它将相似的对象归到一个簇中, 将不相似对象归到不同簇中.相似这一概念取决于所选择的相似度计算方法.K-Means 是发现给定数据集的 K 个簇的聚类算法, 之所以称之为 K-均值 是因为它可以发现 K 个不同...

  • 【机器学习实战】第10章 K-Means(K-均值)聚类算法

    时间:2023-11-10 22:34:14

    第 十 章 K-Means(K-均值)聚类算法K-Means 算法聚类是一种无监督的学习, 它将相似的对象归到一个簇中, 将不相似对象归到不同簇中.相似这一概念取决于所选择的相似度计算方法.K-Means 是发现给定数据集的 K 个簇的聚类算法, 之所以称之为 K-均值 是因为它可以发现 K 个不同...

  • 机器学习:逻辑回归模型算法原理(附案例实战)

    时间:2023-04-03 19:06:27

    机器学习:逻辑回归模型算法原理 作者:i阿极 作者简介:Python领域新星作者、多项比赛获奖者:博主个人首页 ????????????如果觉得文章不错或能帮助到你学习,可以点赞????收藏????评论????+关注哦!???????????? ????????????如果有小伙伴需要数据...

  • 【阿旭机器学习实战】【33】中文文本分类之情感分析--朴素贝叶斯、KNN、逻辑回归

    时间:2023-02-25 08:55:26

    【阿旭机器学习实战】系列文章主要介绍机器学习的各种算法模型及其实战案例,欢迎点赞,关注共同学习交流。 目录 1.查看原始数据结构2.导入数据并进行数据处理2.1 提取数据与标签2.2 过滤停用词2.3 TfidfVectorizer将文本向量化3.利用不同模型进行训练与评估3.1 朴素贝叶斯...

  • 机器学习实战(第五章-Logistics回归-所有代码与详细注解及相关数据文件-python3.7)

    时间:2023-02-24 07:56:53

    本次代码中加入了书上没有提供的可视化过程代码,将各个权重变化趋势很好的展现出来了。该算法是最基础的算法,所以准确率不高,原理还是值得学习的,以前过目就忘的理论知识,实践之后记得牢牢的!那么,正文就从这里开始啦!(我的代码都是可直接运行的,只要环境正确)1、logRegres01_gradient_a...

  • 机器学习实战(第六章-支持向量机-所有代码与详细注解-python3.7)

    时间:2023-02-24 07:55:59

    感谢:本次代码修改了原书中的个别bug,增加了原书中没有展示的数据可视化代码那么,正文就从这里开始啦!(我的代码都是可直接运行的,只要环境正确)1、svm01_SMO_base.py'''简化版的Platt SMO算法100个测试点,训练需要数秒数据可视化参考自:javascript:void(0)...

  • 【转载】协同过滤 & Spark机器学习实战

    时间:2023-02-23 15:36:20

    因为协同过滤内容比较多,就新开一篇文章啦~~聚类和线性回归的实战,可以看:http://www.cnblogs.com/charlesblc/p/6159187.html协同过滤实战,仍然参考:http://www.cnblogs.com/shishanyuan/p/4747778.html其中有一...

  • 机器学习实战之决策树

    时间:2023-02-13 00:17:53

    --  Illustrations by Cornelius Bierer -- 决策树的算法可谓是贴近我们的生活,通过下面的案例,你就会发现我们每天都在有意无意的使用着决策树算法(好厉害的样子)。 小明同学每天早上都要去学校,可步行、乘公交和坐隔壁老王叔叔的车(皮一下很开心)。这时,小明就开始做...

  • 《机器学习实战》笔记——决策树(ID3)

    时间:2023-02-13 00:08:36

    现在要介绍的是ID3决策树算法,只适用于标称型数据,不适用于数值型数据。   决策树学习算法最大的优点是,他可以自学习,在学习过程中,不需要使用者了解过多的背景知识、领域知识,只需要对训练实例进行较好的标注就可以自学习了。   建立决策树的关键在于当前状态下选择哪一个属性作为分类依据,根据不同的目标...

  • 《机器学习实战》-决策树

    时间:2023-02-13 00:04:00

    目录 决策树 决策树简介 决策树的构造 信息增益 划分数据集 递归构建决策树 在 Python 中使用 Matplotlib 注解绘制树形图 Matplotlib 注解 构造注解树 测试和存储分类器...

  • 机器学习实战之 决策树——ID3算法

    时间:2023-02-12 23:30:53

    机器学习实战之 决策树——ID3算法 决策树的含义 所谓决策树,顾名思义,是一种树,一种依托于策略抉择而建立起来的树。机器学习中,决策树是一个预测模型;它代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的是某个可能的属性值,而每个叶子节点则对应根节点到该叶子...

  • 机器学习实战 (2)决策树 (一) ID3算法

    时间:2023-02-12 23:17:21

    转自:百度百科 ID3算法是一种贪心算法,用来构造决策树。ID3算法起源于概念学习系统(CLS),以信息熵的下降速度为选取测试属性的标准,即在每个节点选取还尚未被用来划分的具有最高信息增益的属性作为划分标准,然后继续这个过程,直到生成的决策树能完美分类训练样例。 1背景知识 ID3算法最早是由罗斯...