R语言之ggplot2画图篇

时间:2022-11-22 21:55:03

1. qplot

quick plot

数据集:diamonds

(1)基本用法

eg

library(ggplot2)
length(diamonds)
set.seed(1410)#设定种子数
dsmall<-diamonds[sample(nrow(diamonds),100),]#随机产生样本数
qplot(carat,price,data=diamonds)#画散点图

R语言之ggplot2画图篇

qplot(log(carat),log(price),data=diamonds)
R语言之ggplot2画图篇

color、size、shape

qplot(carat,price,data=dsmall,colour=color)

R语言之ggplot2画图篇

qplot(carat,price,data=dsmall,shape=cut)

R语言之ggplot2画图篇

<span style="font-family: Arial, Helvetica, sans-serif;">qplot(carat,price,data=dsmall,alpha=I(1/20))</span>
设置透明度

R语言之ggplot2画图篇

(2)geom

取值可以为:point、smooth、boxplot、path、line

对于连续型变量:geom可取histogram、freqpoly、density

对于离散型变量:bar

qplot(carat,price,data=dsmall,geom=c("point","smooth"))

R语言之ggplot2画图篇

qplot(carat,price,data=dsmall,geom=c("point","smooth"),span=0.2)

R语言之ggplot2画图篇

qplot(carat,price,data=dsmall,geom=c("point","smooth"),span=1)

R语言之ggplot2画图篇

2.ggplot2

数据(Data)和映射(Mapping) 将数据中的变量映射到图形属性,映射控制了二者之间的关系
标度(Scale) 标度负责控制映射后图形属性的显示方式,具体形式上看是图例和坐标刻度
几何对象(Geometric) 几何对象代表我们在图中实际看到的图形元素,如点、线、多边形等
统计变换(Statistics) 对原始数据进行某种计算,如对二元菜点图加上一条回归线
坐标系统(Coordinate) 坐标系统控制坐标轴并影响所有图形元素,坐标轴可以进行变换以满足不同的需要
图层(Layer) 数据、映射、几何对象、统计变换等构成一个图层,图层可以允许用户一步步的构建图形,方便单独对图层进行修改
分面(Facet) 条件绘图,将数据按某种方式分组,然后分别绘图。分布就是控制分组绘图的方式和排列形式

(1)geom_point

mpg
head(mpg)
p<-ggplot(data=mpg,mapping=aes(x=cty,y=hwy))
p+geom_point()
summary(p)
summary(p+geom_point())

R语言之ggplot2画图篇

#将年份映射到颜色属性
p<-ggplot(mpg,aes(x=cty,y=hwy,colour=factor(year)))
p+geom_point()

R语言之ggplot2画图篇

(2)增加平滑线

p+geom_point()+stat_smooth()

R语言之ggplot2画图篇

p<-ggplot(mpg,aes(x=ctymy=hwy))
p+geom_point(aes(colour=factor(year)))+stat_smooth()

(3)两种等价的绘图方式

#方法一
p<-ggplot(mpg,aes(x=cty,y=hwy))
p+geom_point(aes(colour=factor(year)))+stat_smooth()
#方法二
d<-ggplot()+
  geom_point(data=mpg,aes(x=cty,y=hwy,colour=factor(year)))+
  stat_smooth(data=mpg,aes(x=cty,y=hwy))#此时除了底层画布外,有两个图层,分别定义了geom和stat

(4)用标度来修改颜色取值

p<-ggplot(mpg,aes(x=cty,y=hwy))
p+geom_point(aes(colour=factor(year)))+stat_smooth()+scale_color_manual(values=c("blue","red"))

R语言之ggplot2画图篇

(5)将排量映射到散点大小

p+geom_point(aes(colour=factor(year),size=displ))+
  stat_smooth()+
  scale_color_manual(values=c("blue2","red4"))
R语言之ggplot2画图篇

p+geom_point(aes(colour=factor(year),size=displ),alpha=0.5,position="jitter")+
  stat_smooth()+
  scale_color_manual(values=c("blue2","red4"))+
  scale_size_continuous(range=c(4,10))

R语言之ggplot2画图篇

(6)用坐标控制图形显示的范围

p+geom_point(aes(colour=factor(year),size=displ),alpha=0.5,position="jitter")+
  stat_smooth()+
  scale_color_manual(values=c("blue2","red4"))+
  scale_size_continuous(range=c(4,10))+
  coord_cartesian(xlim=c(15,25),ylim=c(15,40))

R语言之ggplot2画图篇

(7)利用facet分别显示不同年份的数据

p+geom_point(aes(colour=class,size=displ),alpha=0.5,position="jitter")+
  stat_smooth()+
  scale_size_continuous(range=c(4,10))+
  facet_wrap(~year,ncol=1)
R语言之ggplot2画图篇

(8)增加图名并精细修改图例

p<-ggplot(mpg,aes(x=cty,y=hwy))
p+geom_point(aes(colour=class,size=displ),alpha=0.5,position="jitter")+
  stat_smooth()+
  scale_size_continuous(range=c(4,10))+
  facet_wrap(~year,ncol=1)+
  opts(title='汽车油耗与型号')+
  labs(x="每加仑高速公路行驶距离",y="每加仑城市公路行驶距离")+
  guides(size=guide_legend(title="排量"),colour=guide_legend(titile="车型",override.aes=list(size=5)))
R语言之ggplot2画图篇

(9)直方图

p<-ggplot(mpg,aes(x=hwy))
p+geom_histogram()
R语言之ggplot2画图篇

直方图的几何对象中内置有默认的统计变换

p+geom_histogram(aes(fill=factor(year),y=..density..),alpha=0.3,colour="black")+
  stat_density(geom="line",position="identity",size=1.5,aes(colour=factor(year)))+
  facet_wrap(~year,ncol=1)

R语言之ggplot2画图篇

(10)条形图

p<-ggplot(mpg,aes(x=class))
p+geom_bar()
R语言之ggplot2画图篇



class2<-mpg$class
class2<-reorder(class2,class2,length)
mpg$class2<-class2
p<-ggplot(mpg,aes(x=class2))
p+geom_bar(aes(fill=class2))
R语言之ggplot2画图篇

p<-ggplot(mpg,aes(class2,fill=factor(year)))
p+geom_bar(position="identity",alpha=0.5)

R语言之ggplot2画图篇


并立方式

p+geom_bar(position="dodge")
R语言之ggplot2画图篇


叠加方式

p+geom_bar(position="stack")

R语言之ggplot2画图篇

相对比例

p+geom_bar(position="fill")

R语言之ggplot2画图篇

分面显示

p+geom_bar(aes(fill=class2))+facet_wrap(~year)

R语言之ggplot2画图篇

(11)饼图

p<-ggplot(mpg,aes(x=factor(1),fill=factor(class)))+geom_bar(width=1)
p+coord_polar(theta="y")
R语言之ggplot2画图篇

(12)箱线图

p<-ggplot(mpg,aes(class,hwy,fill=class))
p+geom_boxplot()

R语言之ggplot2画图篇

p+geom_violin(alpha=0.3,width=0.9)+geom_jitter(shape=21)
R语言之ggplot2画图篇

3.观察密集散点的方法

增加扰动(jitter)

增加透明度(alpha)
二维直方图(stat_bin2d)

密度图(stat_density2d)

p<-ggplot(diamonds,aes(carat,price))
p+stat_bin2d(bins=60)
R语言之ggplot2画图篇


p+stat_density2d(aes(fill=..level..),geom="polygon")+
  coord_cartesian(xlim=c(0,1.5),ylim=c(0,6000))+
  scale_fill_continuous(high="red2",low="blue4")

R语言之ggplot2画图篇

4.风向风速玫瑰图

#随机生成100次风向,并洪到16个敬意内
dir<-cut_interval(runif(100,0,360),n=16)
#随机生成100次风速,并划分成4种强度
mag<-cut_interval(rgamma(100,15),4)
sample<-data.frame(dir=dir,mag=mag)
#将风向映射到x轴,频数映射到y轴,风速大小映射到填充色,生成条形图后再转为极坐标形式即可
p<-ggplot(sample,aes(x=dir,y=..count..,fill=mag))
p+geom_bar()+coord_polar()
R语言之ggplot2画图篇