R语言---- 数据的基本运算
一、基本运算符号1、基本数学计算+、-、*、/、^、%%(求模)、%/%(整除)注意:求模运算两边若为小数,则整数和小数部分分别求模。例:5.6%%2.22、比较运算>、<、>=、<=、==、!=3、逻辑运算&、|、!、&&、||、xor注意:运算符“...
R语言数据合并使用merge数据追加使用rbind和cbind
R语言中的横向数据合并merge及纵向数据合并rbind的使用我们经常会遇到两个数据框拥有相同的时间或观测值,但这些列却不尽相同。处理的办法就是使用merge(x, y ,by.x = ,by.y = ,all = ) 函数。#合并ID<-c(1,2,3,4)name<-c("A","B...
用R语言的quantreg包进行分位数回归
什么是分位数回归分位数回归(Quantile Regression)是计量经济学的研究前沿方向之一,它利用解释变量的多个分位数(例如四分位、十分位、百分位等)来得到被解释变量的条件分布的相应的分位数方程。与传统的OLS只得到均值方程相比,分位数回归可以更详细地描述变量的统计分布。它是给定回归变量X,...
R语言 write.xlsx() 写入同一excel,及同一sheet注意
write.xlsx(x, file, sheetName="Sheet1", col.names=TRUE, row.names=TRUE, append=FALSE, showNA=TRUE)1、想要将data1写da.xlsx的sheet1、data2写da.xlsx的sheet2中,如下wr...
如何使用R语言解决可恶的脏数据
转自:http://shujuren.org/article/45.html在数据分析过程中最头疼的应该是如何应付脏数据,脏数据的存在将会对后期的建模、挖掘等工作造成严重的错误,所以必须谨慎的处理那些脏数据。脏数据的存在形式主要有如下几种情况:1)缺失值2)异常值3)数据的不一致性下面就跟大家侃侃如...
R语言barplot双坐标作图
需要注意的是,设置其中的柱子的宽度,间隔的宽度。有公式如下width为柱子的宽度space为间隔宽度barnumbers 为柱子数量那么xlim的设置右侧范围为:(width + space) * barnumbers + space
【R笔记】R语言进阶之4:数据整形(reshape)
R语言进阶之4:数据整形(reshape)2013-05-31 10:15 xxx 网易博客 字号:T | T从不同途径得到的数据的组织方式是多种多样的,很多数据都要经过整理才能进行有效的分析,数据整形不仅仅是为了改善数据的外观,也是进行一些统计分析和作图前必要的步骤。数据整形和数据凝练/汇总往往密...
R语言通过loess去除某个变量对数据的影响--CNV分析
当我们想研究不同sample的某个变量A之间的差异时,往往会因为其它一些变量B对该变量的固有影响,而影响不同sample变量A的比较,这个时候需要对sample变量A进行标准化之后才能进行比较。标准化的方法是对sample 的 A变量和B变量进行loess回归,拟合变量A关于变量B的函数 f(b),...
RFM模型及R语言实现
每每以为攀得众山小,可、每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~———————————————————————————一、基本概念根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标:最近一次消费(...
R语言与数据分析之八:时间序列--霍尔特指数平滑法
上篇我和小伙伴们分享了简单指数平滑法,简单指数平滑法仅仅能预測那些处于恒定水平和没有季节变动的时间序列,今天和大家分享非恒定水平即有增长或者减少趋势的。没有季节性可相加模型的时间序列预測算法---霍尔特指数平滑法(Holt)。Holt 指数平滑法预计当前时间的水平和斜率。其平滑水平是由两个參数控制。...
R: 基本的数学运算
################################################### 问题:基本数学运算 18.4.30 R语言用于初等数学的计算,都怎么表示??加减乘除、余数、取整、绝对值、判断正负、平方、幂、对数、向上向下取整、四舍五入、保留小数点后位数、...
新工具︱微软Microsoft Visual Studio的R语言模块下载试用Ing...(尝鲜)
笔者:前几天看到了以下的图片,着实一惊。作为R语言入门小菜鸟,还是觉得很好看,于是花了一点时间下载下来试用了一下,觉得还是挺高大上的。就是英文不好是硬伤。下面贴给小白,我当时的下载步骤与遇见的问题。大神请绕道。欢迎会用的人,能够指导一下俺,俺的确不太熟悉这个界面与应用方式。官方解释:Visual S...
HTML基础介绍(仅介绍涉及R语言爬虫部分内容)
说明:本文参照Simon Munzert著&吴今朝译的《基于R语言的自动数据收集》一书,进行个人二次整合而成,如有侵权,告知后删。 同步转载至个人微信公众号:R语言学习 同步转载至个人知乎专栏:R数据处理 之所以要讲讲HTML的基础知识,是基于目前网络爬虫主要爬取源格式为HTML,本着知己知...
R语言低级绘图函数画个温度计
x <- 1:2y <- runif(2,0,100)par(mar=c(4,6,2,6))plot(x,y,type="n",xlim=c(0.5,2.5),ylim=c(-10,110),axes=F,ann=F)axis(2,at = seq(0,100,20))mtext("Te...
Windows中使用OpenBLAS加速R语言计算速度
在使用R的时候会发现R对CPU的利用率并不是很高,反正当我在使用R的时候,无论R做何种运算R的CPU利用率都只有百分子几,这就导致一旦计算量大的时候计算时间非常长,会给人一种错觉(R真的在计算吗?会不会我的程序死掉了?)。今天,我看到了一篇博客介绍的方法,迫不及待的尝试了一下,只能说:太牛逼了!下面...
R语言数据分析系列之五
R语言数据分析系列之五—— by comaple.zhang本节来讨论一下R语言的基本图形展示,先来看一张效果图吧。watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY29tYXBsZQ==/font/5a6L5L2T/fontsize/400/fill/I0...
R语言入门系列1
1. R对象都有两个基本属性:moede()类型属性和length()长度属性,类似的向量的类型有logical(逻辑性)、numeric(数值型)、complex(复数型)、character(字符型)。 Eg: Z<-0:9 Z<-as.charact...
R语言入门系列2
1. 数组的维数名字 数组可以有一个属dimnames保存各维的各个下标的名字,缺省时为空。 >x<-matrix(1:6,ncol=2,dimnames=list(c("a","b","c"),c("d","e")),byrow=T) > x de a 1 2 b 3 4 c...
R语言入门(一)简介安装
数据挖掘常用的语言有R语言,python,SQL等,其中R语言最受欢迎。(注:SQL Server包含微软研究院开发的两种数据挖掘算法:Microsoft决策树和Microsoft聚集,此外还支持第三方开发的算法。) R语言是由统计学家开发的,一款开源免费的统计绘图语言,可以提供数学统计分析,允许用...
R语言入门系列1
//欢迎加入R语言学习群623311789 nanana,作为一个不合格的数学专业学生,脑袋不好使,又穷逼,只好学点儿实用的东西,希望能养活自己~~~ 不瞎哔哔,想做数据方面工作的时候在犹豫是学R还是学python,一点儿python基础都没有强行用了一个python爬虫,发现python还是比较的...