R语言语法笔记

时间:2023-03-09 03:39:09
R语言语法笔记
## 1. 数据输入 ##
a$b         # 数据框中的变量
a = 15      # 赋值
a <- 15     # 赋值
a = c(1,2,3,4,5)    # 数组(向量)
b = a[1]            # 数组下标,从1开始
b = a[1:5]          # 子数组
b = a[-2]           # 子数组:扣除第2个的子数组
b = a[c(1,3)]       # 子数组:访问第1,3个元素
b = c(a0,a1,a2)     # 连接多个数组
a = rep(c(1,2,3,4),each=8)  # 生成重复数列,支持每个重复和整个重复
a = seq(from=1,to=4,by=1)   # 生成等差数列
b = cbind(a0,a1,a2,a3)      # 按列合并,生成二维数组
b = a[,1]           # 取第1列
b = a[1:4,1]
b = a[,c(1,3,4)]
a = vector(length=8)        # 生成向量
a = matrix(1:20, nrow=8,ncol=4) # 生成矩阵
colnames(a) = c("A","B","C","D")    # 列名称。!! 函数作为左值
b = as.matrix(cbind(a1,a2,a3))      # 利用cbind直接生成矩阵
b = data.frame(b1 = a1,b2 = a2)     # 生成数据框
b = list(c(1,2,3),c("a","b","c","d"),matrix(nrow=2,ncol=2))     # 生成散列
b = a$c == 1    # 生成一个用于筛选的向量 !!较难理解
d = a[b,0]      # 生成符合条件的子集
d = a[a$c == 1,]
b = order(a$c)  # 生成一个用于排序的向量 !!较难理解
a[b,]           # 排序结果
b = merge(a1,a2,by = "Sample",all = "TRUE")     # join两个数据框
a$fb = factor(a$b)  # 因子化
tapply(X=a$b,INDEX=a$c,FUN=mean)    # 对所有子集作函数运算
sapply(a,FUN=mean)  # 对所有列作函数运算,输出向量
lapply(a,FUN=mean)  # 对所有列作函数运算,输出列表
summary(a)          # 计算所有列的基本统计信息
table(a$b)          # 计算列联表
table(a$b,a$c)
paste("a","b",sep=",")  # 连接字符串 

##2. 载入和输出数据 ##
b = read.table(file="C:/data.txt",header=TRUE,dec=".")  # 读取CSV数据
library(RODBC)      # 载入ODBC工具
odbcConnect("MyDb.mdb") # 连接ODBC数据库
b = sqlFetch(channel,"MyTable")     # 取表
write.table(a,file="temp.txt",sep=" ",quote = FALSE, append=FALSE,na="NA")  # 输出

## 3. 绘图 ##
plot(x=a$b,y=a$c,xlab="X",ylab="Y",main="Title",xlim=c(0,10),ylim=c(0,100),pch=1,col=2,cex=1.5) # 散点图,参数多支持向量
lines()         # 曲线
jpeg(file="any.jpg")    # 打开一个jpg文件
dev.off()       # 关闭图片文件

## 4. 语法 ##
for (i in 1:10) {do sth...} # for循环
a = function(a,b="n") {     # 构造函数
    do sht...
}

## A. 函数  ##
# 运算 #
colSums()   # 按列求和
max()
median()    # 中位数
min()
paste()     # 连接字符串
rowSums()   # 按行求和
solve()     # 矩阵求拟
sqrt()      #
sum()       # na.rm=TRUE 忽略NA值
t()         # 矩阵转置

# 数据定义 #
attach()    # 添加数据框为路径
as.matrix() # 作为矩阵
as.data.frame() # 作为数据框
c()         # 连接向量
cbind()     # 按列连接,生成二维
colnames()  # 列名
detach()    # 去除数据框作为路径
dim()       # 行数、列数
factor()    # 因子化
is.matrix() # 是否矩阵
is.data.frame() # 是否数据框
lapply()    # 对所有列作函数运算,输出列表
matrix()    # 生成矩阵
names()     # 查看list的元素名称
nrow()      # 行数
ncol()      # 列数
order()     # 数据框排序
rbind()     # 按行连接
rep()       # 重复数列。 each 自身重复
rm()        # 删除变量
rownames()  # 行名
sapply()    # 对所有列作函数运算,输出向量
seq()       # 等差数列
str()       # 数据框的每个属性
summary()   # 计算所有列的基本统计信息
table()     # 计算列联表
tapply()    # 对所有子集作函数运算
unique()    # 查找剔重值
vector()    # 生成向量

# 环境与载入、输出数据
read.table()    # 读取数据文件
scan()      # 读取数据文件
setwd()     # 设置当前工作目录
write.table()   # 输出文件

# 绘图
jpeg()      # 打开JPG图片
plot()      # 散点图
dev.off()   # 关闭图片文件