数学建模及机器学习算法(一):聚类-kmeans(Python及MATLAB实现,包括k值选取与聚类效果评估)
一、聚类的概念聚类分析是在数据中发现数据对象之间的关系,将数据进行分组,组内的相似性越大,组间的差别越大,则聚类效果越好。我们事先并不知道数据的正确结果(类标),通...
【机器学习—聚类】
# 亲和力传播聚类import numpy as npimport matplotlib.pyplot as pltfrom sklearn.datasets import make_classificationfrom sklearn.cluster import AffinityPropagat...
JavaScript机器学习之线性回归
译者按: AI时代,不会机器学习的JavaScript开发者不是好的前端工程师。原文: Machine Learning with JavaScript : Part 1译者: Fundebug为了保证可读性,本文采用意译而非直译。另外,本文版权归原作者所有,翻译仅用于学习使用JavaScript做...
【机器学习】特征选择之包裹式特征选择法-一 初步了解
1.1 概念 包裹式特征选择法是机器学习中一种常用的特征选择方法,其核心思想是将特征选择问题转化为一个优化问题,通过搜索特征子集的方式来选择最佳的特征组合,以提高模型性能。 与过滤式特征选择方法不同,包裹式特征选择法直接利用模型的性能来评估特征子集的好坏,因此更加贴近实际应用场景。 在包裹式...
Python机器学习(十)经典算法大全
1.KNN 分类算法由于knn算法涉及到距离的概念,KNN 算法需要先进行归一化处理1.1 归一化处理 scalerfrom sklearn.preprocessing import StandardScalerstandardScaler =StandardScaler()standa...
【机器学习】聚类分析的模型评估
一、聚类算法中的距离1. 单个样本之间的距离 余弦距离 在聚类分析中,一般需要对数据进行标准化,因为聚类数据会...
机器学习笔记-决策树(一)
决策树(decision tree)是一类常见的机器学习方法。以二分类任务为例,我们希望从给定训练数据集学得一个模型用以对新的示例进行分类,这个把样本分类的任务,可以看作对“当前样本属于正类吗?”这个问题的“决策”或“判别”过程。顾名思义,决策树是基于树结构来...
机器学习【四】决策树
1、决策树简介1.1 决策树概述决策树算法是一种基于树形结构的分类算法,它能从给定的无序的训练样本中,提炼出树型的分类模型,树形中包含判断模块和终止模块。它是一种典...
机器学习中常见的优化算法
在机器学习中,有很多的问题并没有解析形式的解,或者有解析形式的解但是计算量很大(譬如,超定问题的最小二乘解),对于此类问题,通常我们会选择采用一种迭代的...
Spark-机器学习(1)什么是机器学习与MLlib算法库的认识
从这一系列开始,我会带着大家一起了解我们的机器学习,了解我们spark机器学习中的MLIib算法库,知道它大概的模型,熟悉并认识它。同时,本篇文章为个人spark免费专栏的系列文章,有兴趣的可以收藏关注一下,谢谢。同时,希望我的文章能帮助到每一个正在学习的你们。 Spark-大数据技术与应用http...
【马士兵认证下的】公开课|Java/架构师/大数据/区块链/高并发/分布式/机器学习/人工智能
优效学院由清华大学著名的IT教育领导者马士兵老师创办,是一家线上线下相互融合的互联网+培训机构。公司均由海外留学生和国内行业精英人士担任授课讲师,主要成员均硕士且拥有十多年的行业经验。毕业学生就职于国内BAT以及海外著名公司。优效学院,名师执教,高效学习,成就未来。课程信息通过真实企业项...
文献笔记:机器学习在材料信息学中的应用与展望
原文链接 : https://www.nature.com/articles/s41524-017-0056-5 部分由材料基因组计划推动,部分由算法发展和其他领域数据驱动努力的巨大成功推动,信息学战略开始在材料科学中形成。这些方法导致了替代机器学习模型的出现,该模型能够完全基于过去的数据进行快速...
机器学习的3个数据集
数据集处理步骤查看该数据集对应的描述(摘要,详细描述,变量信息)下载并用 Excel 等工具查看数据集(变量名,数量),根据目的看是否需要变量清洗查看数据集对应的论文SCADI.csv摘要:基于 ICF-CY 的第一个自我护理活动数据集 ICF-CY - 国际功能,残疾和健康分类(青少年版)数据集描...
机器学习中的数据集的制作
参考https://blog.csdn.net/zhangjunp3/article/details/79627824。然后结合自己的与运行过程实际的例子。一、数据集介绍点击打开链接17_Category_Flower 是一个不同种类鲜花的图像数据,包含 17 不同种类的鲜花,每类 80 张该类鲜花...
机器学习——DEAP数据集
DEAP数据集介绍DEAP(Database for Emotion Analysis usingPhysiological Signals),该数据库是由来自英国伦敦玛丽皇后大学,荷兰特温特大学,瑞士日内瓦大学,瑞士联邦理工学院的Koelstra 等人通过实验采集到的,用来研究人类情感状态的多通道...
Python库Gym:打开机器学习与强化学习的大门
Python库Gym:打开机器学习与强化学习的大门 强化学习作为人工智能领域的重要分支,已经在各种领域展现出了巨大的潜力。为了帮助开发者更好地理解和应用强化学习算法,Python库Gym应运而生。Gym提供了一个开放且易于使用的环境,供开发者进行强化学习算法的开发、测试和评估。本文将深入介绍Gy...
机器学习之局部异常因子算法(Local Outlier Factor)
概念 局部异常因子算法(Local Outlier Factor, LOF)是一种用于检测数据集中的异常点的算法。它是一种无监督学习方法,不需要先验标签来识别异常值。相反,它利用数据点周围的局部邻域信息来计算每个数据点的异常程度。 LOF算法的核心思想是,异常点通常在其周围的邻域中具有较低的密度,而...
【机器学习算法】【10】--数据挖掘算法之Apriori详解
前言:数据挖掘与机器学习 有时候,人们会对机器学习与数据挖掘这两个名词感到困惑。如果你翻开一本冠以机器学习之名的教科书,再同时翻开一本名叫数据挖掘的教材,你会发现二者之间有相当多重合的内容。比如机器学习中也会讲到决策树和支持向量机,而数据挖掘的书里也必然要在决策树和支持向量机上花费相当...
机器学习聚类算法简介
算法的目的 :聚类算法是“无监督学习”中最常用的一个算法,通过对无标记训练样本的学习将数据集划分成若干个不相交的子集,来解释数据的内在性质以及规律,为进一步数据分析提供基础。也可以作为一个单独的过程,寻找数据内在的分布结构注意 : 类所对应的概念语义需要由使用者自己把握和命名。对于一个算法的评估我们...
机器学习—多项式回归
7.多项式回归和模型选择7.1多项式回归7.1.1多项式回归的实现思想在现实生活中,很多数据之间是非线性关系;虽然使用多线性回归来拟合非线性数据集,但是其拟合效果是非常的差。#程序7-1import numpy as npimport matplotlib.pyplot as plt np.rand...