数据分析图表解读——生信part

时间:2024-04-12 22:21:21

https://jingyan.baidu.com/article/0964eca212f6a88284f53675.html

16SRNAV3-V4测序效果最佳

1.柱状图

横坐标:各样本,一个条形图代表一个样本;纵坐标:各分类层级(界门纲目科属种)的序列数目或者百分比,不同颜色表示不同层级,序列只计入分类得出的最低层级。

数据分析图表解读——生信part

2韦恩图

一般只能表示五个样本或者分组

数据分析图表解读——生信part

3.稀释曲线

反应样本物种丰度的曲线,横坐标表示随机抽样的序列数量,纵坐标代表OTU数量,曲线延伸的终点位置为该样本的观测数量

 

4.rank-abundance曲线

横坐标为序列数目从大到小排序的OTU序号,纵坐标为该(OTU)物种的相对丰度

5.shannon-winner曲线

利用shannon指数来绘制,反应样品中微生物多样性,利用各样品的测序量在不同测序深度时的微生物多样性指数构建曲线,反应样本在不同测序数量下的多样性。横坐标为随机抽取的序列数量,纵坐标为物种多样性的shannon指数。曲线趋于饱和证明测序无法找到更多OTU,shannon指数公式

其中Sobs为实际测出的OTU数目;ni为含有条序列的OTU数目;N序列总数

数据分析图表解读——生信part

6.Alpha多样性(样本内多样性)

7.Beta多样性(样本间多样性)之PCOA分析图

距离矩阵用于描述两个样本之间的相似程度,数据分析图表解读——生信part

以样本的距离矩阵作为算法的输入,每一个点代表一个样本,相同颜色的点表示来自同一个分组,两点的距离越近则表示两者的群落构成差异越小。

数据分析图表解读——生信part

8.Beta多样性分析之NMDS分析(非度量多维尺度分析)

可以基于进化关系或数量距离矩阵。

横轴和纵轴:表示基于进化或者数量距离矩阵的数值 在二维表中成图。与PCA分析的主要差异在于考量了进化上的信息。

9.LDA差异贡献分析

主要目的找到组间在丰度上有显著差异的物种作为BIomarkers

数据分析图表解读——生信part

10 物种进化树的样本群落分布图

将不同样本的群落构成及分布以物种分类树的形式在一个环图中展示,数据经过分析,将物种分类树和分类丰度通过软件GraPhlAn(http://huttenhower.sph.harvard.edu/GraPhlAn)进行绘制,可以展示:物种之间的进化关系、不同样本之间的物种分布丰度、最高分布样本信息等信息。

中间为物种进化分类树,不同颜色的分支代表不同的纲,之后的外圈灰色标示字母的环是本次研究中比例最高的15个科,之后的外圈提供的是热力圈,热力圈根据丰度绘制,最外圈为柱状图,绘制的是该属所占比例最高的样本的丰度和样本颜色

 数据分析图表解读——生信part

11、聚类分析

根据OUT数据进行标准化处理(1wlog10)之后,选取数目最多的前60个物种,基于R heatmap进行作图,热图中的每一个色块代表一个样品的一个属的丰度,样品横向排列,属纵向排列,两个热图,差异是是否对样品进行聚类,

12.COG构成差异分析图

图中不同颜色代表不同的分组,列出了COG构成在组间存在显著差异的功能分类以及在各组的比例,此外右侧还给出了差异的比例和置信区间以及P-value。