sklearn 中 make_blobs模块使用
sklearn.datasets.make_blobs(n_samples=100, n_features=2, centers=3, cluster_std=1.0, center_box=(-10.0, 10.0), shuffle=True, random_state=None)属性含义:n_...
详解逻辑回归与评分卡-用逻辑回归制作评分卡-重复值和缺失值处理【菜菜的sklearn课堂笔记】
视频作者:菜菜TsaiTsai链接:【技术干货】菜菜的机器学习sklearn【全85集】Python进阶_哔哩哔哩_bilibili在银行借贷场景中,评分卡是一种以分数形式来衡量一个客户的信用风险大小的手段,它衡量向别人借钱的人(受信人,需要融资的公司)不能如期履行合同中的还本付息责任,并让借钱给别...
tensorflow18《TensorFlow实战Google深度学习框架》笔记-08-03 SKlearn封装例子 code
# 《TensorFlow实战Google深度学习框架》08 循环神经网络# win10 Tensorflow1.0.1 python3.5.3# CUDA v8.0 cudnn-8.0-windows10-x64-v5.1# filename:ts08.04.py # SKlearn封装例子fro...
如何在GPU上运行pandas和sklearn?
当涉及大量数据时,Pandas 可以有效地处理数据。但是它使用CPU 进行计算操作。该过程可以通过并行处理加快,但处理大量数据仍然效率不高。 在以前过去,GPU 主要用于渲染视频和玩游戏。但是现在随着技术的进步大多数大型项目都依赖 GPU 支持,因为它具有提升深度学习算法的潜力。 Nvidia的开...
详解逻辑回归与评分卡-步长的进一步理解和max_iter【菜菜的sklearn课堂笔记】
视频作者:菜菜TsaiTsai链接:【技术干货】菜菜的机器学习sklearn【全85集】Python进阶_哔哩哔哩_bilibili既然参数迭代是靠$梯度向量的大小d \times步长\alpha$来实现的,而$J(\theta)$的降低又是靠调节$\theta$来实现的,所以步长可以调节损失函数下...
windows10环境下python安装sklearn
step1: 将python,pip加入环境变量。 step2: win+r,输入cmd,进入命令行 有可能需要更新pip python -m pip install -U pip step3:安装sklearn依赖的包 python -m pip instal...
【集成学习】sklearn中xgboot模块中fit函数参数详解(fit model for train data)
参数解释,后续补上。 1 # -*- coding: utf-8 -*- 2 """ 3 ############################################################################### 4 # 作者:wanglei5205 5...
Python中常用包——sklearn主要模块和基本使用方法
在从事数据科学的人中,最常用的工具就是R和Python了,每个工具都有其利弊,但是Python在各方面都相对胜出一些,这是因为scikit-learn库实现了很多机器学习算法。 加载数据(Data Loading) 我们假设输入时一个特征矩阵或者csv文件。 首先,数据应该被载入内存中。 sc...
sklearn-特征工程之特征选择
title: sklearn-特征工程之特征选择date: 2016-11-25 22:49:24categories: skearntags: sklearn抄袭/参考资料使用sklearn做单机特征工程sckearn中文周志华《机器学习》当数据预处理完成后,我们需要选择有意义的特征输入机器学习的...
如何在sklearn.metrics中为两个函数precision_recall_curve和roc_curve获取相同的阈值
I need to make a table with the TPR and FPR values, as well as precision and recall. I am using the roc_curve and precision_recall_curve functions fro...
模型评估:评价指标-附sklearn API
模型评估 评价指标Evaluation metrics 分类评价指标 1 准确率 2 平均准确率 3 对数损失Log-loss 4 基于混淆矩阵的评估度量 41 混淆矩阵 42 精确率Precision ...
sklearn聚类评价指标
sklearn中的指标都在sklearn.metric包下,与聚类相关的指标都在sklearn.metric.cluster包下,聚类相关的指标分为两类:有监督指标和无监督指标,这两类指标分别在sklearn.metric.cluster.supervised和sklearn.metric.clus...
详解逻辑回归与评分卡-名为“回归”的分类器【菜菜的sklearn课堂笔记】
视频作者:[菜菜TsaiTsai]链接:[【技术干货】菜菜的机器学习sklearn【全85集】Python进阶_哔哩哔哩_bilibili]逻辑回归,是一种名为“回归”的线性分类器,其本质是由线性回归变化而来的,线性回归是机器学习中最简单的的回归算法,它的方程是$$z=\theta_{0}+\the...
svd分解 复原 sklearn和numpy实现
网上有很多分析svd分解原理的文章,例如下面的链接,svd原理解释,本文主要介绍在sklearn和numpy中,如何进行svd分解以及如何复原,可以利用到图像压缩和复原等任务中。 原理 1.pca的主要过程 pca可以将 m ...
sklearn中拟合结果的评价指标
在sklearn中包含四种评价尺度,分别为mean_squared_error、mean_absolute_error、explained_variance_score 和 r2_score。 1、均方差(mean-squared-error) 2、平均绝对值误差(mean_absolute_er...
sklearn的precision_score, recall_score, f1_score使用
1 使用numpy计算true positives等 import numpy as npy_true = np.array([0, 1, 1, 0, 1, 0])y_pred = np.array([1, 1, 1, 0, 0, 1])# true positiveTP = np.sum(np....
# 机器学习算法总结-第八天(SKlearn中的kmeans/随机森林)
随机森林这篇好好看看怎么调参的我调的最佳参数如下,准确率为0.8428671546929973,细节看上篇文章:alg = RandomForestClassifier(n_estimators=145,random_state=1,max_depth=12,min_samples_leaf=1,m...
详解支持向量机-SVC真实数据案例:预测明天是否会下雨-填补缺失值和编码【菜菜的sklearn课堂笔记】
视频作者:[菜菜TsaiTsai]链接:[【技术干货】菜菜的机器学习sklearn【全85集】Python进阶_哔哩哔哩_bilibili]处理分类型变量:缺失值接下来,我们总算可以开始处理我们的缺失值了。首先我们要注意到,由于我们的特征矩阵由两种类型的数据组成:分类型和连续型,因此我们必须对两种数...
sklearn中调用PCA算法
sklearn中调用PCA算法PCA算法是一种数据降维的方法,它可以对于数据进行维度降低,实现提高数据计算和训练的效率,而不丢失数据的重要信息,其sklearn中调用PCA算法的具体操作和代码如下所示:#sklearn中调用PCA函数进行相关的训练和计算(自定义数据)import numpy as...
sklearn神经网络分类
sklearn神经网络分类神经网络学习能力强大,在数据量足够,隐藏层足够多的情况下,理论上可以拟合出任何方程。理论部分sklearn提供的神经网络算法有三个:neural_network.BernoulliRBM,neural_network.MLPClassifier,neural_network...