• R语言学习笔记1

    时间:2023-02-06 01:31:08

    1、中文文本挖掘软件包:tmcn 2、用来消除两向量、列表、数据框等中的相同行或列用函数:setdiff() 3、建立一个空数组,用来装不确定长度数据用方法:a <- numeric() 4、将字符串格式日期转换为Date格式用函数:as.Date(),以数值形式存储,对于R中规定的标准格式:...

  • R语言学习笔记(一)

    时间:2023-02-06 01:31:02

    5.1 加载数据 加载名为 sample.csv 的数据并以 dat 为名称保存,其命令如下。 > dat <- read.csv ("sample.csv") 还可以用下述方法从对话框中选择文件。 > dat <- read.csv (file.choose())...

  • R语言学习笔记

    时间:2023-02-06 01:30:50

    R语言学习笔记(1):R是什么2013-05-10 14:37 心内求法 博客园 字号:T | T在学习量化投资的时候,我发现了R(www.r-project.org)。R到底是什么呢?在开始之前,先看看R的神奇之处。AD: 1. R初窥从CRAN(The Comprehensive R Archi...

  • R语言学习笔记一

    时间:2023-02-06 01:30:44

           由于工作和论文实验的需要,使用R语言已经有半年的时间了。入门书籍是Mr Huang推荐的《An instroduction to statistical learning with application in R》(简称ISLR),这本书不是专门讲解R的使用的,主要是数据挖掘常见方法...

  • R语言学习笔记

    时间:2023-02-06 01:30:32

    1、运行R脚本的方法: *********在R环境下: 方法一: 点击菜单”文件-打开程序脚本“,打开chisq2.R后,再全部选中,点右键,点”运行当前行或所选代码“; 方法二: source("chisq2.R") 但是要首先设置好文件所在路径: 比如你的文件在桌面上先setwd("C:/Use...

  • R语言学习笔记(一)

    时间:2023-02-06 01:30:56

    通过网易云课堂进行的学习:第四节输入文件地址时,上下级之间使用一个反斜杠或者两个斜杠setwd("d:/Rstudy/code")setwd("d:\\Rstudy\\code")安装包install.packages("ggplot2")加载包library(ggplot2)创建一个对象并把它赋值...

  • R语言实战(三)——模拟随机游走数据

    时间:2023-02-05 00:04:33

    一、模拟随机游走数据示例x <- matrix(0,1000,1)for(i in 1:1000){ x[i+1] <- x[i]+rnorm(1)}plot(x,type="l")输出结果二、语法分解1、plot()函数plot(x, y, ...),参数x为x轴数据,参数y为y轴...

  • R语言低级绘图函数-points

    时间:2023-02-04 11:19:01

    points 用来在一张图表上添加点,指定好对应的x和y坐标,就可以添加不同形状,颜色的点了; 基本用法: 通过x和y设置点的坐标 plot(1:5, 1:5, xlim = c(0,6), ylim = c (0,6), type = "n")points(x = c(3, 3), y = c...

  • R学习笔记 第五篇:数据变换和清理

    时间:2023-02-04 08:19:02

    数据分析的工作,80%的时间耗费在处理数据上,而数据处理的主要过程可以分为:分离-操作-结合(Split-Apply-Combine),也就是说,首先,把数据根据特定的字段分组,每个分组都是独立的;然后,对每个分组按照业务需求执行转换;最后,把转换后的结果组合在一起。在数据处理中,经常需要循环访问数...

  • R语言可视化之箱图

    时间:2023-02-03 17:15:45

    lattice包中的箱图 bwplot(Species~Petal.Length,data=iris) 拓展:分位箱图 library(Hmisc)bwplot(Species~Petal.Length,data=iris,panel=panel.bpplot,probs=seq(0.0...

  • 使用R语言画圆弧条形图

    时间:2023-02-03 08:00:12

    之前在微博上看到一个用弧形展示的百分比图,感觉很有创意,就想使用R来实现一样的功能,效果如下: 原图: http://photo.weibo.com/1787567623/wbphotos/large/photo_id/3567461742163767?refer=weibofeedv5 使用R...

  • 基于R语言的时间序列指数模型

    时间:2023-02-03 04:23:23

    时间序列:(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列分析的主要目的是根据已有的历史数据对未来进行预测。(百度百科)主要考虑的因素:1.长期趋势(Long-term trend) : 时间序列可能相当稳定或随时间呈现某种趋势。时间序列趋势一般为线性的(lin...

  • 什么是Spark(四)运算过程中的黑科技

    时间:2023-02-02 12:45:51

    Spark在运算过程中提供了一套完整的机制用来提高效率。1. 用于收集信息的Accumulator,自带增量,用于spark全局收集数据;共享数据;2. 用于提高传输速率的broadcast机制;如果需要将已知大对象比如上万条的List,这些多大几十M甚至更大对象如果传统作为Map对象的方式下放到各...

  • R语言字符串处理相关

    时间:2023-01-31 19:51:59

    > str <- "string" nchar(str) = 6 nchar函数算的是字符的个数 length(str) = 1 length函数算的是向量的长度 > str[1] "string" 这里并没有显示's' 要想得到's','t'这些可以这样做: > s <...

  • R语言主成分分析之SVD

    时间:2023-01-27 17:02:03

    #全数据集PCA all_col_mean = colMeans(data.learn.x) #计算训练集每一列的均值 data.learn.PCAx = data.learn.x cols = ncol(data.learn.x) #获取列数 all_col_sd = a...

  • D02-R语言基础学习

    时间:2023-01-27 16:43:00

    R语言基础学习——D0220190423内容纲要:1、前言2、向量操作(1)常规操作(2)不定长向量计算(3)序列(4)向量的删除与保留3、列表详解(1)列表的索引(2)列表得元素属性(3)更改列表元素(4)删除列表元素(5)合并两个列表(6)将列表转换为向量4、推荐1、前言怕什么真理无穷,进一寸有...

  • R语言学习笔记(数据的读取与保存)

    时间:2023-01-26 22:47:43

    library(MASS)#载入package MASSdata(package="MASS") #查看MASS中的数据集data(SP500,package="MASS") #载入MASS中的SP500数据集data(SP500) #简化写法getwd() #返回当前工作目录setwd("d:/r...

  • R语言Fisher检验的workspace问题

    时间:2023-01-24 14:48:25

    问题描述: stage<-matrix(c(9,14,2,0,4,1,6,12,8,5,13,2,7,15,7,4,13,4,1,18,5),3,7)fisher.test(stage) 软件报错 Error in fisher.test(stage) : FEXACT err...

  • R语言编程艺术#01#数据类型向量(vector)

    时间:2023-01-24 10:42:19

    R语言最基本的数据类型-向量(vector)1、插入向量元素,同一向量中的所有的元素必须是相同的模式(数据类型),如整型、数值型(浮点数)、字符型(字符串)、逻辑型、复数型等。查看变量的类型可以用typeof(x)函数查询。> #插入向量元素> x <- c(88,5,12,13)...

  • 利用R语言分析挖掘Titanic数据集(三)

    时间:2023-01-23 20:06:00

    基于决策树预测获救乘客1)构建一个数据划分函数split.data该函数有三个输入参数:data,p和s.其中data代表输入数据集,参数p从输入集中生成的子集比重,参数s为随机种子。split.data = function(data,p = 0.7,s = 666){set.seed(s) ...