• 机器学习读书笔记-4(多分类学习与类别不平衡问题)

    时间:2024-05-23 08:48:08

    1 多分类学习现实中常常遇到的是多分类的学习任务,有些二分类的学习方法可以直接推广到多分类,在更多情况下,我们是基于一些基本策略,利用二分类学习器来解决多分类问题。下面介绍三种最经典的策略。1.1 “一对一”(one vs one, 简称OvO)OvO将这N个类别进行两两配对,从而产生N(N-1)/...

  • 机器学习算法的类型

    时间:2024-05-23 08:01:10

    按照训练样本提供的信息以及反馈方式的不同,将机器学习算法分为监督学习(每个样本都有标签)、无监督学习(不包含目标标签)、强化学习(通过交互来学习)。1.监督学习定义:如果机器学习的目标是通过建模样本的特征 x 和标签 y 之间的关系:y = f(x, θ)或p(y|x, θ),并且训练集中每个样本都...

  • 图解超经典的KNN算法 - 机器学习算法入门

    时间:2024-05-23 08:01:14

    出品:Python数据之道(ID:PyDataLab)作者:Peter,来自读者投稿编辑:Lemon图解超经典的KNN算法本文中介绍的机器学习算法中的一种监督学习的算法:KNN 算法,全称是 K-Nearest Neighbor,中文称之为 K 近邻算法。它是机器学习可以说是最简单的分类算法之一,同...

  • 阿里巴巴的相关-----ODPS技术架构、Java Web架构、PAI机器学习平台

    时间:2024-05-22 17:38:18

    摘要:ODPS是分布式的海量数据处理平台,提供了丰富的数据处理功能和灵活的编程框架。本文从ODPS面临的挑战、技术架构、Hadoop迁移到ODPS、应用实践注意点等方面带领我们初步了解了ODPS的现状与前景。初识ODPSODPS是分布式的海量数据处理平台,提供了丰富的数据处理功能和灵活的编程框架,主...

  • Spark机器学习的三剑客:RDD、DataFrame和Dataset API

    时间:2024-05-21 19:18:59

    Spark有效处理大规模数据的3个主要工具是RDD、DataFrame和Dataset API。虽然每个API都有自己的优点,但新范式转变支持Dataset作为统一数据API,以满足在单个界面中所有数据处理需求。新的Spark 2.0 Dataset API是一个类型安全的领域对象集合,可以使用函数...

  • 机器学习(二十五)——推荐算法

    时间:2024-05-21 17:49:17

    推荐算法的内容比较庞大,本文首先介绍一些常用的知识点,随着学习的深入,笔者会添加新的内容。笔者理解基于协同过滤的推荐是在基于内容推荐的基础上进行的推广,模型的构建主要需要考虑几个问题:1)如何计算用户对商品的偏好,形成U-V矩阵;2)如何计算物品以及用户的相似度,主要有两种方法:其一、根据用户属性计...

  • 终身机器学习(Lifelong Machine Learning)综述

    时间:2024-05-21 08:40:31

    转自:http://blog.csdn.net/qrlhl/article/details/49364173大概有十几天了没有回来更新博客了吧,这期间遇到了大大小小各种事情,最悲伤的事应该是跟我关系最好的一个哥们的父亲去世了,被酒驾的人撞了,希望叔叔在天国安好!再次告诫各位开车一定不能喝酒,不只是对...

  • 机器学习十大算法 之 kNN(一)

    时间:2024-05-20 21:21:28

    机器学习十大算法 之 kNN(一)最近在学习机器学习领域的十大经典算法,先从kNN开始吧。简介kNN是一种有监督学习方法,它的思想很简单,对于一个未分类的样本来说,通过距离它最近的k个“邻居”,来判断这个样本的类别。kNN也是一种lazy learning(不知道中文是啥)技术,训练代价小、分类代价...

  • 机器人动力学软件—ADAMS学习笔记

    时间:2024-05-20 20:28:21

    ADAMS-第三章-运动副与驱动1、约束对象选择    在进行约束时,在不好选择目标对象时,可以鼠标处单击右键,在列表里选择目标对象,这样不容易约束错误而导致仿真时出错。2、运动仿真参数含义动仿真中的步数大小是控制仿真的精细程度的,如仿真时间50,步数5000,则代表在50秒时间里,运动仿真动画效果...

  • 干货 | 机器学习算法在饿了么供需平衡系统中的应用

    时间:2024-05-20 14:37:57

    干货 | 机器学习算法在饿了么供需平衡系统中的应用image:url(https://ask.qcloudimg.com/avatar/1292807/6341kxs4h2.png?imageView2/2/w/72)">用户1292807发表于携程技术中心订阅830作者简介陈宁,饿了么人工智...

  • 论文篇-----基于机器学习的交通流预测技术的研究与应用

    时间:2024-05-20 14:26:17

    占有率:占有率反映的是交通流在时空维度的占有情况,包括空间占有率和时间占有率,能够刻画交通流的时空特性。空间占有率的定义是:在指定的时间间隔内,某一路段中车辆长度的和与该路段长度的比值。对空间占有率进行测定较为困难,所以一般采用时间占有率。 在指定的时间间隔内,使用某一交通传感器在该时间段内的总的工...

  • 机器学习模型什么时候需要做数据标准化?

    时间:2024-05-20 14:17:15

    机器学习Author:louwillMachine Learning Lab          一直都有朋友在做机器学习模型时有疑问:我的数据要不要做标准化处理?     这个问题笔者也思考过,只不过不够系统,观点也比较单一,所以才有了上图中的【变量单位之间数量级差异过大】的回答。就着这个话题,笔者...

  • 【机器学习】scikit-learn 的SVM算法库使用方法详述

    时间:2024-05-20 12:45:14

    之前通过一个系列对支持向量机(以下简称SVM)算法的原理做了一个总结,本文从实践的角度对scikit-learn SVM算法库的使用做一个小结。scikit-learn SVM算法库封装了libsvm 和 liblinear 的实现,仅仅重写了算法了接口部分。1. scikit-learn SVM算...

  • 【机器学习详解】SVM解二分类,多分类,及后验概率输出

    时间:2024-05-20 12:15:14

    支持向量机(Support Vector Machine)曾经在分类、回归问题中非常流行。支持向量机也称为最大间隔分类器,通过分离超平面把原始样本集划分成两部分。首先考虑最简单的情况:线性可分支持向量机,即存在一个超平面可以把训练样本分开。1.线性可分支持向量机1.考虑一个线性二分类的问题;如下左图...

  • Unity3D机器学习插件ML-Agents ToolKit(v0.5): 环境搭建和3DBallDemo运行

    时间:2024-05-19 17:22:44

    前言:由于项目需要,需要了解U3D的ML-Agents插件。预期目的有几点:ML-Agents的大致框架各个部分的具体实现细节在开始研究前,首先我要搭建实验环境,之后运行官方案例。大致框架:ML-Agents是一个Unity3D的插件,其包含3个高级组件:学习环境,External Communic...

  • AI入门之机器学习(3)多元线性回归

    时间:2024-05-19 12:31:39

    多元回归:回归中包括2个或者2个以上的自变量。 多元线性回归:因变量和自变量之间是线性关系。 如图: 一元线性模型表示:二维空间的一条直线。 二元线性模型(有2个自变量x1和x2)表示:三维空间的一个平面。 y=(W1X1)+(W2X2)+b 多元线性模型表示:直线在高维空间中的推广(即...

  • Python3入门机器学习之8.2F1 Score

    时间:2024-05-19 12:31:10

    Python3入门机器学习8.2 F1 Score有时候我们注重精准率。如股票预测。有时候我们注重召回率。如病人诊断。不过还有一些情况,我们希望获得这两个指标之间的平衡,也就是同时关注精准率和召回率,在这种情况下我们使用一种新的指标,叫做F1 Score。它的目的就是兼顾精准率和召回率这两个指标。F...

  • 【机器学习】笔记--梯度提升(Gradient boosting)

    时间:2024-05-19 12:24:04

    1 提升的概念提升是机器学习技术,可以用于回归和分类问题,它每一步产生一个弱预测模型(如决策树),并加权累加到总模型中;如果每一步的弱预测模型生成都市一句损失函数的梯度方向,则称之为梯度提升(Gradient boosting).梯度提升算法首先给定一个目标函数,它的定义域是所有可行的弱函数集合(基...

  • 机器学习中的奥卡姆剃刀定律

    时间:2024-05-19 12:23:57

    奥卡姆剃刀定律是机器学习选择算法时可参照的标准之一。其含义是:在其他条件一样的情况下,选择简单的那个。该定律的意义在于数据的拟合和低复杂性之间实际上存在着折衷。理论上假设的解决方案越复杂,就越能拟合数据,训练数据误差就会越低 图1但是在现实生活中,有关未知数据的泛化误差,往往如图2所示。 图2泛化数...

  • 机器学习笔记week1——奥卡姆剃刀原则、L1与L2范数正则化、模型泛化性

    时间:2024-05-19 12:23:15

    本系列是学习伯禹《机器学习》的笔记,主要记录自己在学习过程中的盲点和细节继续加油叭fighting本篇目录1 奥卡姆剃刀原则2 L1 与 L2 范数正则化2.1 L1与L2范数正则化可以降低过拟合程度:2.2 L1正则化和L2正则化:2.3 L1正则化不能求导吗?那怎么优化呀?2.4 为什么一般用L...