《机器学习实战》之K-均值聚类算法的python实现
《机器学习实战》之K-均值聚类算法的python实现最近的项目是关于“基于数据挖掘的电路故障分析”,项目基本上都是师兄们在做,我只是在研究关于项目中用到的如下几种算法:二分均值聚类、最近邻分类、基于规则的分类器以及支持向量机。基于项目的保密性(其实也没有什么保密的,但是怕以后老板看到我写的这篇博文,...
机器学习实战 - 读书笔记(07) - 利用AdaBoost元算法提高分类性能
[comment]:#机器学习实战-读书笔记(07)-利用AdaBoost元算法提高分类性能前言最近在看PeterHarrington写的“机器学习实战”,这是我的学习笔记,这次是第7章-利用AdaBoost元算法提高分类性能。核心思想在使用某个特定的算法是,有时会发现生成的算法\(f(x)\)的错...
机器学习实战 - 读书笔记(11) - 使用Apriori算法进行关联分析
[comment]:#机器学习实战-读书笔记(11)-使用Apriori算法进行关联分析前言最近在看PeterHarrington写的“机器学习实战”,这是我的学习心得,这次是第11章-使用Apriori算法进行关联分析。基本概念关联分析(associationanalysis)或者关联规则学习(a...
《机器学习实战》学习笔记-[14]-无监督学习-利用二分K-均值聚类对未标注数据分组
《机器学习实战》学习笔记-[14]-无监督学习-利用二分K-均值聚类对未标注数据分组一、基础(1)二分K-均值(bisectingK-Means)可以一定程度上克服K-均值收敛于局部最小值的问题,算法原理如下:首先,将所有点看作一个簇,然后将该簇二分,之后选择其中一个簇继续划分,选择哪个簇进行划分取...
机器学习 K-均值聚类算法实战(理论+详细的python3代码实现)
一、前言本篇讨论K-means算法的原理、算法流程、K值得确定以及代码实现等等。本文出现的所有代码,均可在我的github上下载,欢迎Follow、Star:Github地址二、基本理论1.Kmeans聚类算法简介由于具有出色的速度和良好的可扩展性,Kmeans聚类算法算得上是最著名的聚类方法。Km...
【机器学习实战-python3】K-均值聚类算法
本篇的数据和代码参见:https://github.com/stonycat/ML-in-Action一、K-均值聚类算法聚类是一种无监督的学习,它将相似的对象归到同一簇中,类似全自动分类。簇内的对象越相似,聚类的效果越好。K-均值聚类是每个类别簇都是采用簇中所含值的均值计算而成。聚类与分类的区别在...
《机器学习实战》代码片段学习6 k均值聚类与二分k均值聚类
概述:本章开始进入无监督学习的内容。聚类方法将相似的对象分到同一个簇中。簇识别:“簇识别给出聚类结果的含义。假定有一些数据,现在将相似数据归到一起,簇识别会告诉我们这些簇到底都是些什么。聚类与分类的最大不同在于,分类的目标事先已知,而聚类则不一样。因为其产生的结果与分类相同,而只是类别没有预先定义,...
机器学习实战--k-均值聚类
1、聚类是一种无监督学习,他讲相似的对象放到同一簇下,有点像自动分类。聚类方法几乎可以用到任何对象上,簇内的对象越相似,聚类结果就越好。2、K均值聚类的优点算法简单容易实现缺点:可能收敛到局部最小值,在大规模数据上收敛速度较慢3、K-均值算法算法流程以及伪代码首先随机选择k个初始点作为质心。然后将数...
《机器学习实战》二分-kMeans算法(二分K均值聚类)
=====================================================================《机器学习实战》系列博客是博主阅读《机器学习实战》这本书的笔记也包含一些其他python实现的机器学习算法 算法实现均采用...
让机器帮你写博客-机器学习实战
我们都对深度神经网络(deepneuralnetwork)的最新发展感到兴奋。在深度学习的各种应用当中,自然语言处理(NaturalLanguageProcess)方面的应用引起了相当多的兴趣。很高兴看到一个机器学习模型可以生成高精度的文本,比如莎士比亚、*、哈利·波特、奥巴马的演讲、星球大战...
《机器学习实战》之一:knn(python代码)
数据标称型和数值型算法归一化处理:防止数值较大的特征对距离产生较大影响计算欧式距离:测试样本与训练集排序:选取前k个距离,统计频数(出现次数)最多的类别1defclassify0(inX,dataSet,labels,k):2'''34:paraminX:测试样本(arr)5:paramdataSe...
机器学习实战基础(九):sklearn中的数据预处理和特征工程(二) 数据预处理 Preprocessing & Impute 之 数据无量纲化
1数据无量纲化在机器学习算法实践中,我们往往有着将不同规格的数据转换到同一规格,或不同分布的数据转换到某个特定分布的需求,这种需求统称为将数据“无量纲化”。譬如梯度和矩阵为核心的算法中,譬如逻辑回归,支持向量机,神经网络,无量纲化可以加快求解速度;而在距离类模型,譬如K近邻,K-Means聚类中,无...
机器学习实战1-1 KNN电影分类遇到的问题
为什么电脑排版效果和手机排版效果不一样~目前只学习了python的基础语法,有些东西理解的不透彻,希望能一边看《机器学习实战》,一边加深对python的理解,所以写的内容很浅显,也许还会有一部分错误,希望得到大家的指正。在看到书上第一个KNN算法,实现简单的电影分类的时候,就遇到了很多问题,在这里把...
[机器学习实战札记] NumPy基础
<<机器学习实战>>一书非常注重实践,对每个算法的实现和使用示例都提供了python实现。在阅读代码的过程中,发现对NumPy有一定的了解有助于理解代码。特别是NumPy中的数组和矩阵,对于初次使用者而言,有点难以理解。下面就总结一下NumPy基础知识。NumPy和SciPy...
《机器学习实战》kMeans算法(K均值聚类算法)
============================================================================================《机器学习实战》系列博客是博主阅读《机器学习实战》这本书的笔记,包含对其中算法的理解和算法的Python代码实现另外...
《机器学习实战》学习笔记 --chapter2 K-近邻算法
kNN算法概述看完kNN算法,其本质就是找到待预测点和其余已知点的距离,并且对其从小到大进行排序,并且取其前K个点,用这K个点来进行判别。伪代码如下:求得待预测点和已知样本点中的特征值的距离:具体是利用几何中的线性距离来进行判别,即欧几里得距离。按距离递增进行排序选取与当前预测距离最小的K个点确定这...
《机器学习实战》之二分K-均值聚类算法的python实现
《机器学习实战》之二分K-均值聚类算法的python实现上面博文介绍了K-均值聚类算法及其用python实现,上篇博文中的两张截图,我们可以看到,由于K-均值聚类算法中由于初始质心的选取,会造成聚类的局部最优,并不是全局最优,因此,会造成聚类的效果并不理想,为克服K-均值算法收敛于局部最小值的问题,...
《机器学习实战》学习笔记——第14章 利用SVD简化数据
一.SVD1.基本概念:(1)定义:提取信息的方法:奇异值分解SingularValueDecomposition(SVD)(2)优点:简化数据,去除噪声,提高算法的结果(3)缺点:数据转换难以想象,耗时,损失特征(4)适用于:数值型数据2.应用:(1)隐性语义索引(LSI/LSA)(2)推荐系统3...
《机器学习实战》之二分K-均值聚类算法的python实现
《机器学习实战》之二分K-均值聚类算法的python实现上面博文介绍了K-均值聚类算法及其用python实现,上篇博文中的两张截图,我们可以看到,由于K-均值聚类算法中由于初始质心的选取,会造成聚类的局部最优,并不是全局最优,因此,会造成聚类的效果并不理想,为克服K-均值算法收敛于局部最小值的问题,...
【机器学习实战】第10章 K-Means(K-均值)聚类算法
第10章K-Means(K-均值)聚类算法K-Means算法聚类是一种无监督的学习,它将相似的对象归到一个簇中,将不相似对象归到不同簇中.相似这一概念取决于所选择的相似度计算方法.K-Means是发现给定数据集的K个簇的聚类算法,之所以称之为 K-均值 是因为它可以发现K个不同的簇,且每个簇的中心采...