• 数学建模及机器学习算法(一):聚类-kmeans(Python及MATLAB实现,包括k值选取与聚类效果评估)

    时间:2024-04-17 07:43:59

    一、聚类的概念聚类分析是在数据中发现数据对象之间的关系,将数据进行分组,组内的相似性越大,组间的差别越大,则聚类效果越好。我们事先并不知道数据的正确结果(类标),通...

  • 【机器学习—聚类】

    时间:2024-04-17 07:12:57

    # 亲和力传播聚类import numpy as npimport matplotlib.pyplot as pltfrom sklearn.datasets import make_classificationfrom sklearn.cluster import AffinityPropagat...

  • JavaScript机器学习之线性回归

    时间:2024-04-16 22:37:34

    译者按: AI时代,不会机器学习的JavaScript开发者不是好的前端工程师。原文: Machine Learning with JavaScript : Part 1译者: Fundebug为了保证可读性,本文采用意译而非直译。另外,本文版权归原作者所有,翻译仅用于学习使用JavaScript做...

  • 【机器学习】特征选择之包裹式特征选择法-一 初步了解

    时间:2024-04-16 08:47:37

    1.1 概念 包裹式特征选择法是机器学习中一种常用的特征选择方法,其核心思想是将特征选择问题转化为一个优化问题,通过搜索特征子集的方式来选择最佳的特征组合,以提高模型性能。 与过滤式特征选择方法不同,包裹式特征选择法直接利用模型的性能来评估特征子集的好坏,因此更加贴近实际应用场景。 在包裹式...

  • Python机器学习(十)经典算法大全

    时间:2024-04-15 22:41:06

     1.KNN 分类算法由于knn算法涉及到距离的概念,KNN 算法需要先进行归一化处理1.1 归一化处理 scalerfrom sklearn.preprocessing import StandardScalerstandardScaler =StandardScaler()standa...

  • 【机器学习】聚类分析的模型评估

    时间:2024-04-15 16:02:51

    一、聚类算法中的距离1. 单个样本之间的距离   余弦距离     在聚类分析中,一般需要对数据进行标准化,因为聚类数据会...

  • 机器学习笔记-决策树(一)

    时间:2024-04-15 10:24:38

    决策树(decision tree)是一类常见的机器学习方法。以二分类任务为例,我们希望从给定训练数据集学得一个模型用以对新的示例进行分类,这个把样本分类的任务,可以看作对“当前样本属于正类吗?”这个问题的“决策”或“判别”过程。顾名思义,决策树是基于树结构来...

  • 机器学习【四】决策树

    时间:2024-04-15 10:24:24

    1、决策树简介1.1 决策树概述决策树算法是一种基于树形结构的分类算法,它能从给定的无序的训练样本中,提炼出树型的分类模型,树形中包含判断模块和终止模块。它是一种典...

  • 机器学习中常见的优化算法

    时间:2024-04-15 07:56:45

     在机器学习中,有很多的问题并没有解析形式的解,或者有解析形式的解但是计算量很大(譬如,超定问题的最小二乘解),对于此类问题,通常我们会选择采用一种迭代的...

  • Spark-机器学习(1)什么是机器学习与MLlib算法库的认识

    时间:2024-04-15 07:04:32

    从这一系列开始,我会带着大家一起了解我们的机器学习,了解我们spark机器学习中的MLIib算法库,知道它大概的模型,熟悉并认识它。同时,本篇文章为个人spark免费专栏的系列文章,有兴趣的可以收藏关注一下,谢谢。同时,希望我的文章能帮助到每一个正在学习的你们。 Spark-大数据技术与应用http...

  • 【马士兵认证下的】公开课|Java/架构师/大数据/区块链/高并发/分布式/机器学习/人工智能

    时间:2024-04-14 20:44:51

          优效学院由清华大学著名的IT教育领导者马士兵老师创办,是一家线上线下相互融合的互联网+培训机构。公司均由海外留学生和国内行业精英人士担任授课讲师,主要成员均硕士且拥有十多年的行业经验。毕业学生就职于国内BAT以及海外著名公司。优效学院,名师执教,高效学习,成就未来。课程信息通过真实企业项...

  • 文献笔记:机器学习在材料信息学中的应用与展望

    时间:2024-04-14 18:59:39

     原文链接 : https://www.nature.com/articles/s41524-017-0056-5 部分由材料基因组计划推动,部分由算法发展和其他领域数据驱动努力的巨大成功推动,信息学战略开始在材料科学中形成。这些方法导致了替代机器学习模型的出现,该模型能够完全基于过去的数据进行快速...

  • 机器学习的3个数据集

    时间:2024-04-14 18:00:52

    数据集处理步骤查看该数据集对应的描述(摘要,详细描述,变量信息)下载并用 Excel 等工具查看数据集(变量名,数量),根据目的看是否需要变量清洗查看数据集对应的论文SCADI.csv摘要:基于 ICF-CY 的第一个自我护理活动数据集 ICF-CY - 国际功能,残疾和健康分类(青少年版)数据集描...

  • 机器学习中的数据集的制作

    时间:2024-04-14 18:00:26

    参考https://blog.csdn.net/zhangjunp3/article/details/79627824。然后结合自己的与运行过程实际的例子。一、数据集介绍点击打开链接17_Category_Flower 是一个不同种类鲜花的图像数据,包含 17 不同种类的鲜花,每类 80 张该类鲜花...

  • 机器学习——DEAP数据集

    时间:2024-04-14 18:00:12

    DEAP数据集介绍DEAP(Database for Emotion Analysis usingPhysiological Signals),该数据库是由来自英国伦敦玛丽皇后大学,荷兰特温特大学,瑞士日内瓦大学,瑞士联邦理工学院的Koelstra 等人通过实验采集到的,用来研究人类情感状态的多通道...

  • Python库Gym:打开机器学习与强化学习的大门

    时间:2024-04-14 16:12:59

    Python库Gym:打开机器学习与强化学习的大门 强化学习作为人工智能领域的重要分支,已经在各种领域展现出了巨大的潜力。为了帮助开发者更好地理解和应用强化学习算法,Python库Gym应运而生。Gym提供了一个开放且易于使用的环境,供开发者进行强化学习算法的开发、测试和评估。本文将深入介绍Gy...

  • 机器学习之局部异常因子算法(Local Outlier Factor)

    时间:2024-04-14 10:18:47

    概念 局部异常因子算法(Local Outlier Factor, LOF)是一种用于检测数据集中的异常点的算法。它是一种无监督学习方法,不需要先验标签来识别异常值。相反,它利用数据点周围的局部邻域信息来计算每个数据点的异常程度。 LOF算法的核心思想是,异常点通常在其周围的邻域中具有较低的密度,而...

  • 【机器学习算法】【10】--数据挖掘算法之Apriori详解

    时间:2024-04-13 21:07:50

    前言:数据挖掘与机器学习        有时候,人们会对机器学习与数据挖掘这两个名词感到困惑。如果你翻开一本冠以机器学习之名的教科书,再同时翻开一本名叫数据挖掘的教材,你会发现二者之间有相当多重合的内容。比如机器学习中也会讲到决策树和支持向量机,而数据挖掘的书里也必然要在决策树和支持向量机上花费相当...

  • 机器学习聚类算法简介

    时间:2024-04-13 19:19:46

    算法的目的 :聚类算法是“无监督学习”中最常用的一个算法,通过对无标记训练样本的学习将数据集划分成若干个不相交的子集,来解释数据的内在性质以及规律,为进一步数据分析提供基础。也可以作为一个单独的过程,寻找数据内在的分布结构注意 : 类所对应的概念语义需要由使用者自己把握和命名。对于一个算法的评估我们...

  • 机器学习—多项式回归

    时间:2024-04-13 19:08:07

    7.多项式回归和模型选择7.1多项式回归7.1.1多项式回归的实现思想在现实生活中,很多数据之间是非线性关系;虽然使用多线性回归来拟合非线性数据集,但是其拟合效果是非常的差。#程序7-1import numpy as npimport matplotlib.pyplot as plt np.rand...