• 机器学习中的回归(regression)与分类(classification) 的理解(区别)

    时间:2024-03-31 10:54:36

    举几个例子:一、二、讨论一下时间序列模型三、用通俗一点的话可以概括为:分类和回归的区别在于输出变量的类型。定量输出称为回归,或者说是连续变量预测;定性输出称为分类,或者说是离散变量预测。举个例子:预测明天的气温是多少度,这是一个回归任务;预测明天是阴、晴还是雨,就是一个分类任务。...

  • 核技巧(Kernel Trick)与支持向量回归(SVR)详解

    时间:2024-03-31 10:52:31

    核技巧(Kernel Trick)与支持向量回归(SVR)详解第十五次写博客,本人数学基础不是太好,如果有幸能得到读者指正,感激不尽,希望能借此机会向大家学习。这一篇内容来自于《机器学习》和林轩田《技法》以及自己的一些理解。这篇文章首先对表示定理(Representor Theorem)进行介绍和证...

  • 利用Weka进行线性回归预测

    时间:2024-03-31 10:46:47

    一、实验目的和内容 (一)实验目的和内容 利用Weka对现有数据进行短期预测。先利用excel和weka软件将数据记性预处理,再将数据载入weka中,开始创建模型并进行预测。通过本实验,掌握Weka软件的使用,对数据创建模型并预测。从而掌握回归分析的基本思想和方法。 (二)背景知识 1、Weka W...

  • 岭回归、Lasso及其分析

    时间:2024-03-30 08:29:26

    基本概念前段我们讨论了线性回归模型的原理策略,假定可以表示为 f(xi)=∑k=1nwkxik+w0=wxi 其损失函数为: J(w)=12m∑i=1m(yi−f(xi))2=12m||y−Xw||2最小二乘法求解可以得到最优解: w=(XTX)−1XTy在讨论ridge regression 和 ...

  • 应用回归分析之岭回归(Ridge Regression,RR)

    时间:2024-03-30 07:52:48

    一、岭回归估计的定义1.1普通最小二乘法带来的问题当自变量间存在复共线性时,回归系数估计的方差就会很大,从而导致估计值不稳定1.2岭回归的定义岭回归(Ridge Regression,RR),当自变量之间存在复共线性时,约等于0,给加上一个正常数矩阵,(),那么接近奇异的程度就会比小的多,考虑到变量...

  • 多因子量化选股模型的筛选和评价:打分法与回归法

    时间:2024-03-28 12:20:35

           多因子选股模型在模型搭建中,往往会涉及到非常多的股价影响因子,并可能导出数量极多的备选模型。因此,对于多因子选股模型的评价和筛选,就显得尤为关键。对于专业的量化投资人而言,就需要进一步了解多因子选股模型的两种主要的评价判断方法——打分法和回归法。 1、打分法的评价原理和流程     所...

  • LASSO回归之特征选择

    时间:2024-03-28 10:01:31

    MLE --framework – MAPMLE:argmaxP(D∣θ)MLE:argmax P(D|\theta)MLE:argmaxP(D∣θ)MAP:argmaxP(θ∣D)MAP:argmaxP(\theta|D)MAP:argmaxP(θ∣D) = argmaxP(D∣θ)P(θ)arg...

  • Tableau进行时间序列、线性回归

    时间:2024-03-27 16:59:14

    Tableau进行时间序列、线性回归一、线性回归第一步,打开“全球超市订单数据.xlsx”;第二步,生成折线图。将“订购日期”放入列,选择“月,”“销售额”放入行;第三步,构建趋势线。在图中,右击,选择“显示趋势线”;第四步,显示趋势线公式。首先,点击趋势线,右击,选择“描述趋势线”;然后,复制里面...

  • Logestic回归算法笔记

    时间:2024-03-27 15:40:16

    Logestic回归算法笔记前言对于分类问题,比如二分类,输出y一共分为负类(记为0)和正类(记为1),即 y∈{0,1}。如果使用线性回归的方式解决,如果存在与同类样本中特征差别较大的个体,可能导致的得到的假设函数 hθ(x)h_θ(x)hθ​(x) (θ为待优化参数) 的分类效果较差。Loges...

  • 用R语言进行Cox回归生存分析

    时间:2024-03-27 10:36:22

    欢迎关注”生信修炼手册”!在生存分析中,探究生存时间的影响因素是一个重要的研究内容,通过KM和log-rank test检验的方法,只能够处理单个二分类因素的生存数据。当想探究多个因素或者离散型变量对生存时间的影响时,我们就需要借助于cox回归方法。cox回归的全称如下cox proportiona...

  • 分段函数回归问题

    时间:2024-03-27 10:16:47

    为什么80%的码农都做不了架构师?>>>   在设计离散事件系统的控制算法时,有一种方式是用“多项式+待定系数”来“回归”出控制策略来。如果系统本身比较接近连续系统,所得到的策略可能会有极好的效果;但万一系统离散性过强,在不同的状态下有着迥异的行为,其有效策略可表示为分段函数,泰勒...

  • 转载使用随机森林(R语言)做回归

    时间:2024-03-27 10:16:23

    使用随机森林(R语言)做回归 Corina 学定量 2016-01-25 阅读 2357 评论 0引言1 数据2 步骤2.1 安装randomForest包2.2 使用randomForest包2.3 导入数据2.4 数据的初步处理2.5 多元线性回归分析2.6 随机森林回归引言随机森林( rand...

  • 【概率基础】从概率角度去解释回归和分类的主要区别是什么?

    时间:2024-03-26 11:21:04

    1. 从概率角度去解释回归和分类的主要区别是什么? 从概率角度来看,回归和分类任务的主要区别在于它们各自预测的目标变量的性质,以及如何使用概率来对这些预测进行建模。 回归 回归任务旨在预测一个连续值的目标变量。在概率术语中,回归模型通常试图估计条件概率分布 ...

  • GPT结合R语言回归模型、多元统计分析、混合效应模型、结构方程实战案例

    时间:2024-03-26 11:03:29

    查看原文>>>科研新边界:GPT & R语言联手,让数据分析不再难! 自2022年GPT(Generative Pre-trained Transformer)大语言模型的发布以来,它以其卓越的自然语言处理能力和广泛的应用潜力,在学术界和工业界掀起了一场革命。在短短一年多的...

  • 基于R语言的lmer混合线性回归模型

    时间:2024-03-25 18:04:15

    混合模式适合需求吗?混合模型在很多方面与线性模型相似。它估计一个或多个解释变量对响应变量的影响。混合模型的输出将给出一个解释值列表,其效应值的估计值和置信区间,每个效应的p值以及模型拟合程度的至少一个度量。如果您有一个变量将您的数据样本描述为您可能收集的数据的子集,则应该使用混合模型而不是简单的线性...

  • 使用线性回归,岭回归,Lasso回归预测鲍鱼年龄

    时间:2024-03-25 17:53:24

    实验目的 掌握数据预处理方法 掌握线性回归预测基本原理与实现。 实验问题背景 鲍鱼的年龄可以通过鲍鱼壳的“环数”来判断,但是获取这个“环数”是十分耗时的,需要锯开壳,然后在显微镜下观察得到。 可以通过鲍鱼的其他特征比如性别、长度、直径、高度、整体重量、去壳后重量、脏器重量、壳的重量等,通过机器学习的...

  • “新一线城市”榜单出炉 去年落榜的无锡为何又强势回归?

    时间:2024-03-25 08:58:46

    ▼点击上方蓝字 关注网易智能为你解读AI领域大公司大事件,新观点新应用榜单出炉  第一财经周刊日前发布“2018中国城市商业魅力排行榜”,中国城市分级新榜出炉。北上广深依旧牢牢占据了一线城市榜,无锡重返“新一线城市”依据最新一年的170个品牌商业数据、19家互联网公司的用户行为数据及数据机构的城市大...

  • 数学模型--岭回归和Lasso回归

    时间:2024-03-25 08:04:54

    一、岭回归和Lasso回归的基础_OLS回归的矩阵推导传统的回归上,增加了限定条件 (惩罚项 )OLS:普通最小二乘法简化,可估计 回归里很重要的 y = xβ + ε1.假定一:线性假定2.假设二:严格外生性保证估计出来的回归系数无偏且一致扰动项均值为03.假定三:完全无 多重共线性保证能估计出来...

  • NG机器学习总结-(三)线性回归以及python实现

    时间:2024-03-24 08:25:02

    在前面已经简单介绍了回归问题(预测房价),其实在统计学中,线性回归(Linear Regression)是利用被称为线性回归方程的最小平方函数(Cost Function)对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数式一个或多个被称为回归系数的模型参数的线性组合。----此话出...

  • 简单的线性回归与最小二乘法

    时间:2024-03-23 19:31:12

    一  理论与基础自变量:样本的特征数值因变量:需要预测的样本的预测值1  简单线性回归(simple linear regression)y:样本的预测值,即回归模型中的应变量x:样本的特征数值,即回归模型中的自变量:回归模型中的误差项,误差项说明了包含在y里面,但不能被x与y之间线性关系解释的变异...