• 代码进阶 算法学习-----数据挖掘原理与应用-------第一章

    时间:2024-03-29 20:23:23

    数据挖掘是一种处理大数据的技术,在我展开仔细讲述之前,先说明我是准备如何讲述的 我会分为十次文章讲解 第一章:介绍数据挖掘 第二章:数据挖掘的第一步 第三章:数据挖掘的第二步 第四章:数据挖掘的第三步 第五章:数据挖掘的第四步 第六章:数据挖掘的第五步 第七章:数据挖掘的第六步 第八章:数据挖掘的工...

  • 数据仓库和数据挖掘基础知识点

    时间:2024-03-26 19:23:30

                                                    第一章  数据仓库和数据挖掘概述一、概念题1、数据仓库的定义是什么?     答:数据仓库是面向主题的、集成的、稳定的、不同时间的数据集合,用于支持经营管理中央决策制定过程。2、数据仓库的特点是什么?  ...

  • 【第十二届“泰迪杯”数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索—解题全流程(持续更新)

    时间:2024-03-26 16:52:20

    2024 年(第 12 届)“泰迪杯”数据挖掘挑战赛B题 解题全流程(持续更新) -----基于多模态特征融合的图像文本检索 一、写在前面: ​ 本题的全部资料打包为“全家桶”, “全家桶”包含:模型数据、全套代码、训练好的模型权重、结果csv、教程、详细实验过程PPT、教学视频、成品论文(还在写作...

  • 利用cBioportal数据库进行肿瘤基因的挖掘

    时间:2024-03-25 15:07:08

    查找肿瘤靶药预后风险相关基因位点,在没有找到相关的肿瘤panel的情况下,可以去cBioportal这个数据库去根据肿瘤类型查找频率很高的基因,然后把鼠标放在某个基因上,就会看到图一提示:进入OncoKB Cancer Gene List,看到图二界面 : 对于每个基因都进行了分类(癌基因还是易感基...

  • office 安装 excel 最新 数据挖掘插件

    时间:2024-03-25 13:46:41

    本教程支持, office2013~2019,365 sql server2008~2019需要先安装好office,要官方原版下载最新的数据挖掘插件Download 适用于 Microsoft® Office® 的 Microsoft® SQL Server® 2012 SP4 数据挖掘外接程序 ...

  • SPSS Modeler18.0数据挖掘软件教程(六):聚类分析-K-means

    时间:2024-03-24 08:11:00

    教程传送门:SPSS Modeler18.0数据挖掘软件教程(一):背景及软件简介SPSS Modeler18.0数据挖掘软件教程(二):数据描述性统计与可视化SPSS Modeler18.0数据挖掘软件教程(三):逻辑回归分析SPSS Modeler18.0数据挖掘软件教程(四):分类分析-决策树...

  • 《数据挖掘导论》学习 | 第九章 聚类分析:其他问题与算法

    时间:2024-03-24 08:10:12

    目录第九章 聚类分析:其他问题与算法数据、簇和聚类算法的特性比较K均值和DBSCAN数据特性簇特性聚类算法的一般特性基于原型的聚类模糊聚类使用混合模型的聚类自组织映射基于密度的聚类基于网格的聚类子空间聚类基于图的聚类稀疏化最小生成树聚类OPOSSUM:使用METIS的稀疏相似度最优划分Chamele...

  • AI:150-基于深度学习的医学数据挖掘与病症关联发现

    时间:2024-03-23 21:32:18

    ????点击这里跳转到本专栏,可查阅专栏顶置最新的指南宝典~ ???????????? 你的技术旅程将在这里启航! 从基础到实践,深入学习。无论你是初学者还是经验丰富的老手,对于本专栏案例和项目实践都有参考学习意义。 ✨✨✨ 每一个案例都附带关键代码,详细讲解供大家学习,希望可以帮到大家。正在...

  • 数据挖掘概念与技术(第三版)课后答案——第四章

    时间:2024-03-23 20:12:56

    =============需要原版答案请留言!!==============4.1 试述多个异构信息源的集成,为什么许多公司更喜欢更新驱动的方法(构造和使用数据仓库),而不是查询驱动的方法(适用包装器和集成器)。 描述查询驱动的方法比更新驱动的方法更可取的情况。对于决策查询和经常问到的查询,更新驱动...

  • 【数据挖掘学习笔记】9.高级聚类方法

    时间:2024-03-23 16:14:45

    一、密度聚类基于距离的方法– 适用于发现类球状的簇– 在交通等领域,非球状簇的挖掘效果较差– 判断是否“聚”的依据不仅仅有距离基于密度进行聚类的思想– 发现“密”的区域– 判断密的区域的连通性– DBSCAN(Density-Based Spatial Clustering of Applicati...

  • 【数据挖掘】数据挖掘概述

    时间:2024-03-23 15:51:39

    一、数据挖掘产生的背景1、从数据分析看数据 政治算法、概率论与数理统计、数据挖掘 2、主要原因催生数据挖掘 海量数据的分析需求 应用对理论的挑战大数据的特征 3V——Volume(海量)、Variety(多样)、Velocity(实时) 海量——数据量巨大,对TB、PB数据级的处理,已经成为基本配置...

  • 【机器学习】数据挖掘算法——关联规则(三),FP-growth算法

    时间:2024-03-23 15:11:42

    前言  上一篇文章介绍了用来挖掘发现强关联规则的Apriori算法。同时也知道了Apriori算法在实现过程中由于需要频繁的扫描数据集导致效率较低。  FP-growth算法基于Apriori构建,但采用了高级的数据结构减少扫描次数,大大加快了算法速度。FP-growth算法只需要对数据库进行两次扫...

  • 数据挖掘入门_泰坦尼克号存活预测之数据清洗(含数据)【一】

    时间:2024-03-23 14:31:28

    文章目录==数据下载链接==背景理解问题观察数据数据清洗缺失值处理年龄:Age舱位:Cabin港口:Embarked删除无法利用的列分属性清洗是否存活:Survived客舱等级:Pclass名字:Name性别:Sex年龄:Age家庭成员数:SibSp,Parch票价:Fare数据下载链接链接:htt...

  • 十大经典数据挖掘算法【PageRank篇】

    时间:2024-03-22 20:26:58

    PageRank可以较为直观的理解为是对网页重要性排序的一种算法。 Googel 能在全球互联网搜索引擎中处于较高地位,该算法功不可没。 导 读 早期的搜索引擎通过计算用户查询关键词与网页内容的相关程度来返回搜索结果,即关键词匹配算法。 但该种搜索引擎会极容易遭受Term Spam攻击,导致用户体验...

  • 【数据挖掘学习笔记】10.频繁模式挖掘基础

    时间:2024-03-22 10:40:48

    一、基本概念频繁模式– 频繁的出现在数据集中的模式– 项集、子序或者子结构动机– 发现数据中蕴含的事物的内在规律• 项(Item) – 最小的处理单位 – 例如:Bread, Milk• 事务(Transaction) – 由事务号和项集组成 – 例如:<1, {Bread,Milk}>...

  • 如何通过数据分析来挖掘用户需求

    时间:2024-03-21 21:37:20

    要分析哪些维度的数据呢?在这里我们总结了3种:第一种是属性数据,例如用户的年龄、性别、地区、学历等信息,获取信息的方法主要是让用户自己填写,比如注册时让用户填写地区、年龄等信息,通过一些活动、测评机制获取用户职业、学历、消费能力等信息;第二种是来源渠道数据,用户从哪个渠道来,从哪个活动来,这个渠道的...

  • 零基础入门数据挖掘系列之「建模调参」

    时间:2024-03-21 20:01:25

    摘要:对于数据挖掘项目,本文将学习如何建模调参?从简单的模型开始,如何去建立一个模型;如何进行交叉验证;如何调节参数优化等。 建模调参:特征工程也好,数据清洗也罢,都是为最终的模型来服务的,模型的建立和调参决定了最终的结果。模型的选择决定结果的上限, 如何更好的去达到模型上限取决于模型的调参。 ...

  • 构建一个数据挖掘模型,基本分为哪几步?

    时间:2024-03-20 22:04:50

    数据挖掘的目的,就是从数据中找到更多的优质用户。什么是有指导的数据挖掘方法模型,以及数据挖掘如何构建模型。在构建一个有指导的数据挖掘模型,首先要理解和定义一些模型试图估计的目标变量。首先要定义模型的结构和目标。二、增加响应建模。三、考虑模型的稳定性。四、通过预测模型、剖析模型来讨论模型的稳定性。下面...

  • 李涛:深度解读大数据时代的数据挖掘

    时间:2024-03-20 12:43:52

    3月13日下午,南京邮电大学计算机学院、软件学院院长、教授李涛在CIO时代APP微讲座栏目作了题为《大数据时代的数据挖掘》的主题分享,深度诠释了大数据及大数据时代下的数据挖掘。众所周知,大数据时代的大数据挖掘已成为各行各业的一大热点。一、数据挖掘在大数据时代,数据的产生和收集是基础,数据挖掘是关键,...

  • R语言microeco:一个用于微生物群落生态学数据挖掘的R包(构建microeco对象。

    时间:2024-03-18 19:40:40

    我以前写过临床微生物组的文章,其中数据分析用过microeco包,在这里,将我学到的资源分享给大家。 R语言microeco:一个用于微生物群落生态学数据挖掘的R包。 主要功能R6类;分类群丰度图,维恩图,Alpha多样性,Beta多样性,差异丰度分析,环境数据分析,零模型分析,网络分析,功能分析。...