本课程从基础知识、常用模型与案例入手,较为全面地介绍了R语言,是R语言入门与拓展的基础学习资料。本课程以数据科学为主线,内容涵盖数据获取、数据描述、数据分析、数据挖掘、数据可视化的理论知识及其主要实现方法,每章配有综合实验,引导学生利用所学进行实践,为应用开发打下基础。本课程内容分为基础篇、进阶篇、拓展篇三大模块,9个章节,支持“R语言程序设计”、“数据科学素养”等课程的32-64学时,支持个性化教学、分层教学、混合式教学等多种教学模式。
北京交通大学R语言程序设计(2023秋)作业题答案
第1章 R语言概述
- R语言的优点有() A开源免费 B跨平台 C编程简单 D扩展性强
- 包,是R函数、实例数据、预编译代码的集合, 包括R程序, 注释文档、实例、测试数据等…
- R语言中,setwd( )函数的作用为:更改当前工作目录
- R语言是一种区分大小写的解释性语言
- R语言中,语句的单行注释符为:*
- 下列变量标识符正确的是() Aaabb2 B_aabb2 C2_aabb2 D.aabb2
第2章 数据对象
- R语言的数据类型包括() A字符型 B逻辑型 C向量 D特殊值
- R语言中用于查看未知类型的数据的函数有() Amode( ) Bclass( ) Ctypeof( ) Dint( )…
- R语言常见的数据类型的转换函数有 ( ) Aas.numeric( ) Bas.character( ) Cas.logical( ) Das.…
- R语言中,最常处理的数据结构是向量
- R语言的数据结构包括() A向量 B矩阵 C数据框 D列表
- 属于R语言中的数据结构的是() A向量 B矩阵 C数组 D以上全是
- 代码 x[ x>3 & x<5 ]的含义是() Ax中所有大于3且小于5的元素 Bx中索引序号在区间( 3, 5 )的元素 …
- x[-n]表示除了第n个元素的x
- 代码 rep( 1 : 2 , 2 )的运行结果是() A1 2 1 2 B1 1 C2 2 D1 2
- 函数dim( )可以返回矩阵或数组的维度的整数值
- 设A为一个矩阵, 则函数colSums( A )对矩阵各列求和
- 若M表示一个矩阵,则t( M )表示对矩阵进行() A转置 B取绝对值 C求和 D取余…
- 数据框的合并包括行、列的合并,用到的函数有哪些 ( ) Amerge( ) Bcbind( ) Crbind( ) Dbbind( …
- R语言中,创建数据框的函数是() Adata.frame( ) Bdata( ) Cframe( ) Ddataframe( )…
- R语言中,将列表转为向量的函数是() Alist( ) Bc( ) Cnames( ) Dmatrix( )…
第3章 数据管理
- R语言的选择控制结构有() Aif-else Brepeat Cswitch Dwhile
- R语言中适用于一个条件、又有多个分支的选择结构语句是() Awhen Bif Cswitch Dswatch…
- R语言提供的循环控制语句有() Aif-else Belse Ccontinue Dbreak
- 代码 a <- function( x, y ) {z <- x^2+y^2 ; x+y+z} ; a( 0 : 2, 1 ),输出结果是( ) …
- 关于R语言的函数,以下说法正确的是( ) AR语言大量使用函数,掌握好函数的用法可以完成很多工作。 …
- 以下代码的运行结果是( ) 1 2 3 4 5 6 7 8 > S <- function(x, y){ a <- x …
- apply函数族是一组常用核心函数的集合,主要包括的函数有 Aapply( ) Blapply( ) Ctapply( ) Ds…
- 代码 x <- matrix(1:20,ncol=4);apply(x,2,mean)的运行结果是 A3 8 13 18 B8.5 9.5 10.5 11.5 1…
- 代码 apply(iris[ ,1:4],1,mean) 的作用是,将iris数据集的前四列数据,按行求均值。…
- 常用的用于存储数据的文本文件格式有( ) txt csv xls doc
- CSV格式的文件是由逗号分隔的文本文件
- TXT格式的文件是由制表符分隔的文本文件
第4章 数据可视化
- R语言中,在同一个绘图窗口可以使用两个plot( )函数
- 使用plot( )绘制图形后,还可使用一些函数来增加图形元素,以下关于这些函数说法正确的是 ( ) Aablin…
- R语言中,创建饼图的函数是() Apie( ) Bbarplot( ) Ccurve( ) Dplot( )
- ggplot2包的特点是() A将绘图与数据分离 B按图层作图 C更具灵活性 D将常见的统计变换融入到了绘…
- ggplot2包中,qplot( )函数的功能是() A快速作图 B生成箱形图 C生成条形图 D生成散点图…
- ggplot2包中,下列哪个函数是几何绘图函数() Ageom_XXX( ) Bstat_XXX( ) Cscale_XXX( ) Dpie_XXX(…
第5章 数据探索
- 以下关于数据描述相关函数说法正确的是 ( ) Amean( ) #求平均值 Bsd( ) #求标准差 Cvar( ) #求…
- 以下关于which( )及相关函数说法正确的是 ( ) Awhich(x>3) #返回 x中元素大于3 的数字的位置 Bw…
- 下列函数中是对矩阵各列求均值的函数是() Ancol( ) Bnrow( ) CcolMeans( ) DrowMeans( )…
- 数据清洗主要是删除原始数据集中的无关数据、处理缺失值、重复值、异常值等工作…
- 在数据挖掘过程中,数据预处理是很重要的工作,它的主要任务包括() A数据变换 B数据清洗 C数据集成 …
- 以下关于数据标准化说法正确的是() A数据标准化处理是数据分析的一项基础工作,由于不同评价指标往往…
第6章 数据分析
- 生成随机数、使用随机抽样进行数据操作时,用到的函数有哪些 ( ) Arunif( ) Bsample( ) Ct.test(…
- 生成随机数时,可以设定生成特定分布的随机数。经常使用的分布有( ) A 正态分布 B 均匀分布 C …
- 使用runif( )函数生成均匀分布且默认为0和1之间的随机值,round( )函数按照四舍五入取整, ceiling( …
- 假设检验(hypothesis testing),又称统计假设检验,是用来判断样本与样本、样本与总体的差异是由抽样误…
- 代码 t1 <- rnorm(100, mean=0, sd =4); t.test(t1, mu=0) 的作用是:生成一组正态分布的随机数…
- 检验变量的相关性函数是( ) A cor.test( ) B t.test( ) C cor( ) D rnorm( )…
- 下列关于回归方程的说法,正确的是() A回归方程可以表明自变量和因变量之间的显著关系。 B回归方程…
- 经常使用lm( )函数来快速拟合线性回归模型
- 经常使用glm( ) 函数建立广义线性模型。
第7章 数据挖掘
- 常见的分类模型的性能评估指标有( ) A 准确率 B 精确率 C 召回率 D F1-Score…
- 在回归任务(对连续值的预测)中,常见的评估指标有( ) A 平均绝对误差(Mean Absolute Error,MAE) …
- 建立混淆矩阵的函数是( ) A mean( ) B table( ) C which( ) D round( )
- 用于决策树的R语言包有() Aparty Bcluster Carules Dtree
- 用于回归分析的R语言包有() Astats Bparty Carules Dbase
- 常见的分类与回归模型有( ) 决策树 朴素贝叶斯 随机森林 人工神经网络…
- 用于聚类的R语言包有() Astats Bcluster Carules Dparty
- 在聚类中涉及到的名词有() A欧氏距离 B距离 C相似系数 D支持度
- 主成分分析(Principal Component Analysis,PCA)是把各变量之间互相关联的复杂关系进行简化分析的方…
- Rattle的特点主要有( ) A 免费的开源数据挖掘工具包 B 用于快速处理常见的数据挖掘问题 C …
- 安装Rattle使用的第三方包有( ) A install.packages(“RGtk2”) B install.packages(“rattle…
- Rattle界面上的工具标签主要有( ) A Data B Explore C Model D Evaluate E Log…
第8章 高级特性
- R语言中的面向对象特性中应用最多的是泛型函数,常用的泛型函数有哪些 ( ) Aplot( ) Bprint( ) C…
- 面向对象的编程(Object Oriented Programming,OOP)的3个特征是( ) A封装,继承,递归 B封装,继承,多态 C…
- R语言支持的面向对象有( ) AS3 BS4 CS5 DRC
- R语言性能提升的方法有( ) A 优化代码,尽量使用向量化的方式处理数据 B 将代码中最消耗CPU的核…
- system.time( )函数用来计算代码的执行时间。
- 以下关于并行计算,说法错误的是( ) A R语言内置了parallel包和许多并行计算函数和工具,强化了并行…
第9章 应用拓展
- 以下说法正确的是( ) A 概率论与数理统计是一门研究和揭示随机现象统计规律的数学学科。 B 多…
- 矩阵常用的函数有( ) A matrix( )函数用来建立矩阵 B diag( )建立特殊的矩阵 C t( )函数进行…
- 多元统计分析是数理统计学的一个重要分支,它能够在多个对象和多个指标互相关联的情况下分析出统计…
- 关联规则是发现事物之间关联关系的分析过程。在R语言中,经常使用的关联规则包有( ) A arules B …
- 智能推荐是通过一定的方式将用户和物品联系起来。R语言常使用的推荐包是( ) A arules包 B reco…
- 时间序列分析的目的,是找寻时间序列数据的变化发展规律,用过去的观测值来预测未来值。以下说法正确…