从零开始系列-R语言基础学习笔记之二 数据结构(二)

时间:2024-01-06 09:51:26

上一篇中我们一起学习了R语言的数据结构第一部分:向量、数组和矩阵,这次我们开始学习R语言的数据结构第二部分:数据框、因子和列表。

一、数据框

类似于二维数组,但不同的列可以有不同的数据类型(每一列内的数据类型应当一致)。创建数据框使用的关键字是data.frame,用法是:

data.frame(..., row.names = NULL, check.rows = FALSE,

check.names = TRUE, fix.empty.names = TRUE,

stringsAsFactors = default.stringsAsFactors())

例如一个简单的学生成绩表如下:

从零开始系列-R语言基础学习笔记之二 数据结构(二)

可以使用如下格式访问:

从零开始系列-R语言基础学习笔记之二 数据结构(二)

二、因子

因子可用于对一个向量分类或分组,其关键字是factor,用法是:

factor(x = character(), levels, labels = levels,
       exclude = NA, ordered = is.ordered(x), nmax = NA)

例如对姓氏分组:

从零开始系列-R语言基础学习笔记之二 数据结构(二)

三、列表

列表可以是若干向量、数组、矩阵、数据框等的组合,创建列表使用的关键字是list,例如:

从零开始系列-R语言基础学习笔记之二 数据结构(二)

可通过如下方式访问列表:

从零开始系列-R语言基础学习笔记之二 数据结构(二)

四、总结

  • 向量:一维数组,关键字c,数据类型必须一致。
  • 数组:维度可以大于2,关键字array,所有数据类型必须一致。
  • 矩阵:二维数组,关键字matrix,所有数据类型必须一致。
  • 数据框:类似于二维数组,关键字data.frame,不同的列可以有不同的数据类型,但每一列内的数据类型应当一致。
  • 列表:可以是若干向量、数组、矩阵、数据框等的组合,关键字list。

在下一篇中我们一起来看一下R语言的条件控制和循环。

作者: bigdata大数据

出处: http://www.cnblogs.com/bigdata01/

本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出 原文链接。 如有问题, 可 邮件 咨询。