admin 管理员组

文章数量: 887184


2023年12月20日发(作者:程序员进阶)

R语言基本函数集合

基本

一、数据管理

vector:向量

numeric:数值型向量

logical:逻辑型向量

character;字符型向量

list:列表

:数据框

c:连接为向量或列表

length:求长度

subset:求子集

seq,from:to,sequence:等差序列

rep:重复

NA:缺失值

NULL:空对象

sort,order,unique,rev:排序

unlist:展平列表

attr,attributes:对象属性

mode,typeof:对象存储模式与类型

names:对象的名字属性

二、字符串处理

character:字符型向量

nchar:字符数

substr:取子串

format,formatC:把对象用格式转换为字符串

paste,strsplit:连接或拆分

charmatch,pmatch:字符串匹配

grep,sub,gsub:模式匹配与替换

三、复数

complex,Re,Im,Mod,Arg,Conj:复数函数

四、因子

factor:因子

codes:因子的编码

levels:因子的各水平的名字

nlevels:因子的水平个数

cut:把数值型对象分区间转换为因子

table:交叉频数表

split:按因子分组

aggregate:计算各数据子集的概括统计量

tapply:对“不规则”数组应用函数

数学

一、计算

+, -, *, /, ^, %%, %/%:四则运算

ceiling,floor,round,signif,trunc,zapsmall:舍入

max,min,pmax,pmin:最大最小值

range:最大值和最小值

sum,prod:向量元素和,积

cumsum,cumprod,cummax,cummin:累加、累乘

sort:排序

approx和approx fun:插值

diff:差分

sign:符号函数

二、数学函数

abs,sqrt:绝对值,平方根

log, exp, log10, log2:对数与指数函数

sin,cos,tan,asin,acos,atan,atan2:三角函数

sinh,cosh,tanh,asinh,acosh,atanh:双曲函数

beta,lbeta,gamma,lgamma,digamma,trigamma,tetragamma,pentagamma,choose ,lchoose:与贝塔函数、伽玛函数、组合数有关的特殊函数

fft,mvfft,convolve:富利叶变换及卷积

polyroot:多项式求根

poly:正交多项式

spline,splinefun:样条差值

besselI,besselK,besselJ,besselY,gammaCody:Bessel函数

deriv:简单表达式的符号微分或算法微分

三、数组

array:建立数组

matrix:生成矩阵

:把数据框转换为数值型矩阵

:矩阵的下三角部分

:生成矩阵或向量

t:矩阵转置

cbind:把列合并为矩阵

rbind:把行合并为矩阵

diag:矩阵对角元素向量或生成对角矩阵

aperm:数组转置

nrow, ncol:计算数组的行数和列数

dim:对象的维向量

dimnames:对象的维名

row/colnames:行名或列名

%*%:矩阵乘法

crossprod:矩阵交叉乘积(内积)

outer:数组外积

kronecker:数组的

Kronecker积

apply:对数组的某些维应用函数

tapply:对“不规则”数组应用函数

sweep:计算数组的概括统计量

aggregate:计算数据子集的概括统计量

scale:矩阵标准化

matplot:对矩阵各列绘图

cor:相关阵或协差阵

Contrast:对照矩阵

row:矩阵的行下标集

col:求列下标集

四、线性代数

solve:解线性方程组或求逆

eigen:矩阵的特征值分解

svd:矩阵的奇异值分解

backsolve:解上三角或下三角方程组

chol:Choleski分解

qr:矩阵的QR分解

chol2inv:由Choleski分解求逆

五、逻辑运算

<,>,<=,>=,==,!=:比较运算符

!,&,&&,|,||,xor():逻辑运算符

logical:生成逻辑向量

all,any:逻辑向量都为真或存在真

ifelse():二者择一

match,%in%:查找

unique:找出互不相同的元素

which:找到真值下标集合

duplicated:找到重复元素

六、优化及求根

optimize,uniroot,polyroot:一维优化与求根

人大经济论坛 评谷(pinggu) 统计软件培训班

人大经济论坛统计软件培训中心

“R语言初级班”培训班通知

当今社会,统计软件已经广泛应用于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研、教育等多个行业和领域。

统计分析软件不仅在数据处理、计量分析、数据挖掘等方面发挥着优势,而且是学术研究中的一把利器,现代研究工作更看重对数据的计量分析、更看重对客观事实的研究,掌握统计分析软件的应用,无疑有助于学术研究水平和能力的提升,有益于更有效率的产出学术成果。

其中R语言是一门应用领域广泛,且方法不断创新的应用统计学课程。北京国富如荷网络科技有限公司联合人大经济论坛统计培训中心推出R语言培训班,详情如下:

一、培训时间、地点:

培训时间:2014年8月9日至2014年8月11日 (三天)

培训地点:上海市南京东路培训教室

授课安排:

(1) 授课方式:采用R软件,中文多媒体互动式授课方式

(2) 授课时间:上午9:00至12:00; 下午1:00至4:00; 答疑4:00至4:30

二、讲师介绍:

阎老师,长期从事与市场相关的数据分析的理论研究、教学和实践工作。长期关注科学软件与编程语言的发展和国内外各行业的应用情况,一直保持着与统计应用前沿的密切接触,在数据挖掘应用、市场研究应用等领域经验丰富。一直以来钟情于R语言,后因Python“移情别恋”,再后来倾向于让R与Python相互扶持共同发挥- 1 -

人大经济论坛 评谷(pinggu) 统计软件培训班

作用。擅长企业数据分析和企业诊断,参与多项国家级、省级课题的科研工作,曾任多家电商企业的运营顾问和培训师,积累了大量实战经验。。

三、课程导语和培训内容

(1)课程导语

初级课程分为三大部分,分别是对R语言的概览,R语言统计基础,以及R语言在数据分析与处理方面的应用。

第一部分:不可否认,一门课程的学习方式会直接影响我们对知识的吸收和自主思考的提升空间,这也是为什么大学生入学教育中都会开设专业导论和课程导论的原因所在。因此,我们在本次课程的第一部分中,除了必要的介绍和R作为数据分析平台的诸多特性之外,还会和大家一起对R的学习思路进行理顺,并且用简单的例子建立对学习的自信心。

第二部分:很多用户最初接触R都是为了绘制图形,但本次课程我们并没有在一开始就向大家灌输创建、修改和保存图形的方法,而是首先和大家一起了解如何管理数据,包括各种导入数据的方式,和数据集的排序、合并、取子集,以及变量的转换、重编码和删除。这是工具使用的前奏,磨刀不误砍柴工,我们将仔细讲解每个命令的作用。图形只是使用工具的表现形式,因此被放在了数据管理的后面。

第三部分:这一部分是对R这个工具的使用,因此我们需要了解一些必要的应用知识,首先我们会演示如何总结数据,包括使用描述统计量和交叉表,之后会介绍针对一个数值型结果变量与一系列数值型预测变量间的关系进行建模的回归方法,详细给出了拟合模型的方法、适用性评价和含义解释。

本课程最大的特点是用大量的范例和小示例,加上引导问题来帮助大家主动思考并吸收课程内容,以便未来独立操作时能够更好的实现和机器的交互。

(2)课程大纲

第一部分 R的功能、应用及课程概览

0. R软件和包的下载及安装 (讲义给出详细介绍,并配有视频讲解,不占用授课时间)

- 2 -

人大经济论坛 评谷(pinggu) 统计软件培训班

1.1 R语言在学术领域的应用

范例:三产业从业人员的趋势预测分析

1.2 R语言在商业领域的应用

1. R语言的广泛应用(0.5 H) 范例:节目收视率分析

2.1 课程概览

2.2 思路整理

2. 课程概览及学习逻辑(0.5 2.3 学习资料建议

H) 2.4 安装情况检查

3.1 R的用户界面介绍

3.2 通过函数获取帮助

3.3 包的载入及使用

3.4 管理工作空间的函数

3. R语言的功能(2.0 H) 3.5 基本操作实践

第二部分 R语言基础

4.1 对象及属性

4.2 数据结构(向量、矩阵、数组、数据框、因子、列表)

4.3 数据的输入和写出

4.4 数据集的标注

4. 创建数据集(3.0 H) 4.5范例:介绍处理数据的实用函数

5.1 引导问题:性别对工作风格的影响

5.2 变量的基本操作及缺失值处理

5.3 数据排序

5. 数据管理(2.0 H) 5.4 合并数据集

- 3 -

人大经济论坛 评谷(pinggu) 统计软件培训班

5.5 数据集取子集

5.6 数据框操作

5.7 数值与字符处理函数

6.1 控制流:重复与循环

6.2 控制流:条件执行

范例:比赛分数的绝对优势

6.3 编写自己的函数

范例:自己编写概率质量函数

练习: 编写累积分布函数

6. 效率提升(2.0 H) 6.4 批处理

7.1 Plot函数作图

范例:世界GDP前十名图形表示

7.2 作图命令与函数

7.3 多元数据的图形表示及示例

范例:车重与每加仑英里数的气泡图

7. 基础绘图(2.0 H) 练习:美国各地区平均文盲率排序的条形图

第三部分 R语言数据分析与处理

8.1 描述统计

8.2 频数和交叉列联表

8.3 相关假设检验

范例:产品质量差异分析

8.4 组间差异的非参数检验

8. 基础统计分析(3.0 H) 范例:用户收入对购买行为的影响

- 4 -

人大经济论坛 评谷(pinggu) 统计软件培训班

练习:刑罚制度对犯罪率的影响

9.1 OLS回归基础回顾

9.2 lm()拟合回归模型

9.3 一元线性回归

范例:CEO薪水与股本回报率

练习:居民消费和收入的关系

9.4 多元线性回归

范例:国家税收与工商税收和农业税收之间的关系

专题:有交互项的多元线性回归

9.5 多项式回归

范例:零售价格分类指数与时间的关系

9. 回归分析(3.0 H) 专题:局部多项式回归拟合

四、培训费用:

2400元(含发票、报名费、培训费、资料费)

差旅及食宿费用自理

汇款方式:支持在线支付,银行汇款等多种方式,详情请查看:

/

五、报名办法:

在下列地址进入填写报名信息:/view/262_

请点击底部“我要报名”确认报名信息,开课前一周发送培训教室路线图,培训现场领取发票

- 5 -

人大经济论坛 评谷(pinggu) 统计软件培训班

主办单位:

人大经济论坛统计软件培训中心

(北京国富如荷网络科技有限公司)

二零一四年六月十日

- 6 -

联系方式:

魏老师

电话:

Q Q: 1143703950

邮箱: vip@


本文标签: 数据 函数 应用