• 机器学习调查报告:Python是数据科学家使用最多的语言!

    时间:2024-04-01 11:54:41

    数据平台 Kaggle 近日发布了 2017 机器学习及数据科学调查报告,这也是 Kaggle 首次进行全行业调查。调查共收到超过 16000 份回复,受访内容包括最受欢迎的编程语言、不同国家数据科学家的平均年龄、不同国家的平均年薪等。下面主要看看工具使用方面的结果。请注意,该报告包含多个国家的数据...

  • Python_机器学习_Hadoop海量数据实现原理

    时间:2024-03-30 11:23:40

    Hadoop海量数据实现原理单点结构面临的问题集群架构面临的问题Hadoop集群架构冗余化数据存储分布式文件系统单点结构海量数据例子集群架构2. 集群架构面临的问题节点故障网络带宽瓶颈3. Hadoop 分布式集群Map-Reduce集群运算问题的解决方案在多节点上冗余地存储数据,以保证数据的持续性...

  • python 机器学习(引言-莺尾花分类)

    时间:2024-03-29 16:47:10

                                                        莺尾花分类 一、实验简介    1、目标:        构建一个机器学习模型,从已知品种的莺尾花测量数据中进行学习,从而能够预测新莺尾花的品种。    2、莺尾花测量数据:        花瓣长...

  • 【机器学习】使用Python中的局部敏感哈希(LSH)构建推荐引擎

    时间:2024-03-27 20:54:12

    学习如何使用LSH在Python中构建推荐引擎; 一种可以处理数十亿行的算法你会学到:在本教程结束时,读者可以学习如何:通过创建带状疱疹来检查和准备LSH的数据选择LSH的参数为LSH创建Minhash使用LSH Query推荐会议论文使用LSH构建各种类型的推荐引擎目录你会学到:局部敏感哈希(LS...

  • 机器学习之python入门指南(二)元组、集合、字典的使用

    时间:2024-03-26 21:40:02

    Python3中元组、集合、字典的使用Python中元组的用法元组的创建与访问元组和列表类似,不同之处在于元组不能修改,元组使用小括号,列表使用方括号,注意元组中如果只包含以个元素需要在后面加,否则会被当作运算符使用元组与字符串类似,下标索引从0开始,可以进行截取,取舍。元组可以使用下标索引来访问元...

  • Python3入门机器学习之9.3核函数

    时间:2024-03-26 21:37:32

    Python3入门机器学习9.3 核函数首先回顾一下SVM算法的本质,就是求解以下最优化问题:在求解这个最优化问题的过程中,我们需要将其变形,变成在数学上更好解的形式(不进行推导过程的介绍):在我们转变的这个式子中,对于样本数据集任意的两个向量都要进行向量间的点乘。如果我们想使用多项式特征的话,方块...

  • python机器学习---模型选择3【欠拟合(高偏差)、过拟合(高方差)以及相关模型改善方法和建议】

    时间:2024-03-26 09:03:05

    一、当模型预测未知数据效果误差巨大时,解决方法?当我们用已经训练好的模型来预测未知数据发现巨大误差时,下一步要做的改进模型的方法通常有六种:1.获得更多的训练样本----解决高方差2.尝试减少特征的数量----解决高方差3.尝试获得更多的特征----解决高偏差4.尝试增加多项式特征----解决高偏差...

  • 竞赛 python 机器视觉 车牌识别 - opencv 深度学习 机器学习-2 效果演示

    时间:2024-03-25 18:02:33

    首先还是用动图先展示一下效果,系统主要实现的功能是对图片、视频中的车牌进行检测和识别,演示效果如下。 2.1 图片检测识别 2.2视频检测识别 ...

  • Python 机器学习及实践从零开始通往 Kaggle竞赛之路(持续更新 ing)

    时间:2024-03-25 16:34:36

    文章目录第一章 简介篇1.1 机器学习综述1.2 Python 编程库介绍1.3 Python编程基础第二章 基础篇2.1 监督学习经典模型2.1.1 分类学习2.1.2 回归预测2.1.3 监督学习的基本框架和流程2.2 无监督学习经典模型第三章第四章第五章第一章 简介篇1.1 机器学习综述机器学...

  • NG机器学习总结-(三)线性回归以及python实现

    时间:2024-03-24 08:25:02

    在前面已经简单介绍了回归问题(预测房价),其实在统计学中,线性回归(Linear Regression)是利用被称为线性回归方程的最小平方函数(Cost Function)对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数式一个或多个被称为回归系数的模型参数的线性组合。----此话出...

  • windows系统安装 Python 环境及其机器学习Jupyter Notebook 环境文档

    时间:2024-03-22 10:26:08

    一、安装 Python建议大家安装 Python3.6 版本或者 Python3.7。安装Python环境和机器学习环境前,请先读完本文。本文是以Python3.7版本为例:0.查看电脑系统类型安装前请注意查看电脑系统类型,此电脑或者我的电脑,鼠标右键——属性,出现如下图查看电脑系统类型(图中显示电...

  • 机器学习笔记16——决策树剪枝算法原理及python实现案例

    时间:2024-03-20 19:18:51

    决策树剪枝算法1、算法目的2、算法基本思路:3、决策树损失函数4、剪枝类型:4.1 预剪枝4.2 后剪枝4.3 两种剪枝策略对比1、算法目的决策树的剪枝是为了简化决策树模型,避免过拟合。同样层数的决策树,叶结点的个数越多就越复杂;同样的叶结点个数的决策树,层数越多越复杂。剪枝前相比于剪枝后,叶结点个...

  • 机器学习:第五步:Python 上实现机器学习的基本算法(logistic 回归)

    时间:2024-03-17 21:25:36

    第1章绪论题目来源:http://suo.im/S2beL数据来源:https://github.com/ajschumacher/gadsdata/tree/master/lemons 1.1研究背景一个汽车经销商在汽车拍卖平台采购一个二手车所面临的一个巨大的挑战是可能购买到有一系列问题的汽车,从...

  • python机器学习——欠拟合与过拟合

    时间:2024-03-14 16:00:50

    欠拟合与过拟合欠拟合和过拟合(1)泛化能力(2)欠拟合(3)过拟合(4)机器学习中好的拟合(5)两个例子(6)如何判断一个模型是欠拟合还是过拟合参考文献所谓拟合,是指机器学习模型在训练的过程中,通过更新参数,使得模型不断契合可观测数据(训练集)的过程,但在这个过程中容易出现欠拟合和过拟合的情况:一开...

  • 《Python数据分析与机器学习实战-唐宇迪》读书笔记第15章-降维算法

    时间:2024-03-12 08:22:13

    唐宇迪的《跟着迪哥学:Python数据分析与机器学习实战》,2019年9月出版,本系列为读书笔记。主要是为了系统整理,加深记忆。 第...

  • 计算机设计大赛 深度学习验证码识别 - 机器视觉 python opencv

    时间:2024-03-09 17:53:02

    文章目录 0 前言1 项目简介2 验证码识别步骤2.1 灰度处理&二值化2.2 去除边框2.3 图像降噪2.4 字符切割2.5 识别3 基于tensorflow的验证码识别3.1 数据集3.2 基于tf的神经网络训练代码4 最后 0 前言 ???? 优质竞赛项目系列,今天要分享的是...

  • Python机器学习——Agglomerative层次聚类

    时间:2024-03-08 21:55:01

    层次聚类(hierarchical clustering)可在不同层次上对数据集进行划分,形成树状的聚类结构。AggregativeClustering是一种常用的层次聚类算法。   其原理是:最初将每个对象看成一个簇,然后将这些簇根据某种规则被一步步合并,就这样不断合并直到达到预设的簇类...

  • python机器学习实现线性回归

    时间:2024-03-08 20:46:13

    ...

  • 小象学院Python机器学习和算法高级版视频教程

    时间:2024-02-29 22:16:24

    下载地址:百度网盘下载├─00、课程介绍│      《机器学习·升级版II》常见问题FAQ - 小象问答-hadoop,spark,storm,R,hi.jpg│      《机器学习》升级版II,11月4日开课 - ...

  • Python机器学习算法 — 决策树(Decision Tree)

    时间:2024-02-29 16:43:33

    决策树 -- 简介        决策树(decision tree)一般都是自上而下的来生...