机器学习(Machine Learning)是人工智能的核心研究领域之一,并取得了广泛的应用效果,是引领这一轮“人工智能热潮”的关键技术支撑。《机器学习初步》课程覆盖机器学习的入门基石内容,课程主讲人周志华教授是领域内学者,所著《机器学习》(网友昵称为“西瓜书”)正是本课程的教材。本课程的教学目标是使学生对机器学习有初步的认识,初步掌握机器学习的基本原理和方法,并初步形成利用机器学习技术解决问题的思维方式。
南京大学机器学习初步(2022秋)章节测试题答案
绪论
- 下列有关机器学习基本术语的说法错误的是 A从数据中学得模型的过程称为“学习”或“训练” B训练…
- 以下关于机器学习预测任务的说法错误的是() A一般地,预测任务是希望通过对训练集进行学习,建立一个…
- 聚类算法是机器学习中一种典型的____学习算法。(监督/无监督)
- 学出来的模型适用于新样本的能力,称为 ____ 能力。该能力越强,说明学得的模型越能很好地适用于整个…
- 学得模型后,使用其进行预测的过程称为____。
- 根据训练数据是否拥有标记信息,我们可以将学习任务分为两大类,监督学习和____。…
- 分类和回归任务,按照数据是否拥有标记信息来说,属于机器学习中的____。…
- 下列不属于机器学习任务的是() A人脸识别 B网页编写 C文本分类 D销量预测…
- 下列说法错误的是() A模型是通过学习算法得到的 B机器学习通常解决高度不确定性和复杂性的问题 …
- 下列说法错误的是() A“色泽”取值为“青绿”,这里的“青绿”是属性值 B输出是离散值的学习任务为…
- 下列说法错误的是() A学得模型适用于新样本的能力称为“泛化”能力 B机器学习一般有“独立同分布…
- 把见过的汽车分成若干组,这是一个____(分类/回归/聚类)任务
- 上完机器学习课,小明在50个数据集上用不同算法模型进行训练和测试,发现算法a的效果一直比算法b好,他…
- 奥卡姆剃刀原则中,两个假设哪一个“更简单”,是____(容易/不容易)判断的。…
- 下列关于归纳偏好的说法错误的是() A机器学习算法在学习过程中对某种类型假设的偏好,称为“归纳偏好…
模型评估与选择
- 在训练集上的误差被称作 A泛化误差 B经验误差 C测试误差 D以上三个选项都不对…
- 当学习任务对数据分布的轻微变化比较鲁棒且数据量较少时,适合使用什么样的数据集划分方式? A留出…
- 我们通常将数据集划分为训练集,验证集和测试集进行模型的训练,参数的验证需要在__上进行,参数确定后…
- 当西瓜收购公司去瓜摊收购西瓜时既希望把好瓜都收走又保证收到的瓜中坏瓜尽可能的少,请问他应该考…
- 两种算法在某种度量下取得评估结果后不能直接比较以评判优劣的原因中,正确的是 A测试性能不等于…
- 训练模型时,选择经验误差最小的模型会存在什么风险。____(过拟合/欠拟合)…
- 对于从数据(0,1),(1,0),(1,2),(2,1)通过最小二乘拟合的不带偏置项的线性模型y=x,其训练误差(均方误…
- 使用留出法对数据集进行划分时,为了保持数据分布的一致性,可以考虑什么采样。____(分层采样/随机采…
- 当我们使用留出法对数据集进行划分后,在训练集上通过两个不同的算法训练出2个模型,并通过测试集上…
- 考虑一个三分类数据集,其由30个西瓜,30个苹果,30个香蕉构成。先有一个学习策略为预测新样本为训练集…
- 当我们使用留一法进行评估时会出现什么问题。____(训练模型与使用整个数据集训练的模型差异大/经…
- 考虑如下分类结果混淆矩阵,其F1度量为____(保留3位小数)
- McNemar检验基于____(成对t检验/卡方检验)
- 假设我们已经建立好了一个二分类模型, 输出是0或1, 初始阈值设置为0.5, 超过0.5概率估计就判别为…
- 对于留出法,下列说法正确的是 A测试集小的时候,评估结果的方差较大 B训练集小的时候,评估结果的偏…
线性模型
- 下列关于对数几率回归的描述中错误的是? A无需事先假设数据分布 B使用对数函数作为联系函数 C可得…
- 孙悟空想请你帮他预测下一次妖精会在多久后出现,你会使用下列哪种方法? A使用历史上妖精出现的时…
- 处理类别不平衡问题时,复制小类样本不是一种好的过采样方法,下列哪个不是其原因? A复制样本效率低…
- Jerry想通过西瓜的重量、西瓜的颜色、西瓜根蒂的长短来判断一个西瓜是否是好瓜,Jerry记录了一些购…
- 小明想利用心率数据、运动与用餐时间间隔这两项数据来预测是否会发生低血糖,他利用平时锻炼数据收…
- 下列哪个模型不是广义线性模型?
- 下列哪个选项不是多元线性回归使用正则化的原因? A计算机数值精度有限 B样例维度大于样例数 C…
- 在求解对率回归时,下列哪个选项不是极大似然法的优势? A优化目标是凸函数 B具有闭式解 C可以使用…
- 给定数据集,最小二乘法学得的线性模型的斜率为____ (保留3位小数)。…
- 给定数据集,最小化数据集到线性模型的欧式距离的平方和学得的线性模型满足。对于数据集,这一方法学…
- 比较上述两题求得的斜率值,最小二乘法求得的斜率____(大于/等于/小于) 最小化数据集到线性模型欧…
- OvR是一种常用的多分类方法,该方法每次将一个类的样例作为正例、所有其他类的样例作为反例。对于…
- 对率回归可以得到样例是正类的概率的____(精确值/近似估计)。
- 对率回归____(需要/不需要) 事先假设数据分布。
- 多元线性回归不满秩的情况下____(是/否)可以通过加入归纳偏好来选取较好的解。…
决策树
- 决策树划分时,当遇到以下哪种情形时,将结点标记为叶节点,其类别标记为当前样本集中样本数最多的类 …
- ID3决策树划分时,选择信息增益最____(大/小)的属性作为划分属性
- 若数据集的属性全为离散值,决策树学习时,____(可以/不可以)把用过的属性再作为划分属性。…
- 下列说法错误的是() A信息增益准则对可取值较少的属性有所偏好 BC4.5算法并不是直接选择增益率最…
- 对视频中出现的西瓜数据集2.0(《机器学习》教材第76页),属性“触感”和“色泽”,____(触感/色泽)的增益…
- 对视频中出现的西瓜数据集2.0(《机器学习》教材第76页),属性“色泽”的基尼指数为____(保留2位有效数…
- 随着决策树学习时的深度增加,会发生什么现象? A位于叶结点的样本越来越少 B不会把数据中不该学到…
- 只学习一颗决策树作为模型时,一般____(要/不要)选择剪枝
- (本题需阅读教材79-83页中剪枝的例子)考虑如图的训练集和验证集,其中“性别”、“喜欢ML作业”是属…
- (本题需阅读教材79-83页中剪枝的例子)考虑如图的训练集和验证集,其中“性别”、“喜欢ML作业”是属…
- 下列说法正确的是() A决策树处理缺失值时,仅通过无缺失值的样例来判断划分属性的优劣 B若数据中存…
- 决策树处理有缺失值样本时,一个样本在各子节点中的权重和为____(保留一位小数)…
- 关于剪枝,下列说法错误的是() A对于同一棵树,进行预剪枝和后剪枝得到的决策树是一样的 B决策树的剪…
- 通常来说,子节点的基尼不纯度与其父节点是什么样的关系? A通常更低 B通常更高 C永远更高 D永远…
支持向量机
- 下列关于支持向量机的用法正确的是? A当数据是线性可分时,可以考虑支持向量机的基本型 B当数据是…
- 下列哪一项是支持向量机基本型对偶问题的KKT条件?
- 下面关于支持向量机的优化错误的是? A可以通过常规的优化计算包求解 B可以通过SMO进行高效的求…
- 考虑两个正例样本(0,0),(1,1)和两个负例样本(1,0),(0,1),这四个样本是线性不可分的,通过下列哪一个…
- 下面关于支持向量回归说法正确的是 A当样本距离超平面的距离小于一定程度时,没有损失 B解具有稀…
- 支持向量机的“间隔”定义为两个异类支持向量到超平面的距离之和6.1.png,支持向量机的核心思想是_…
- 支持向量机对偶问题得到的目标函数最优值是原始问题目标函数最优值的____(上界/下界)…
- 考虑正类样本(-1,0),(0,1),(-1,1) 和负类样本(1,0),(0,-1),(1,-1),若使用支持向量机算法,则其支持…
- 支持向量机的解具有什么性质?____(三个字)
- 在求解支持向量机对偶问题时,引入的拉格朗日乘子____(有/没有)约束条件。…
- 对于两个样本点(0,0),(1,1),若我们将其投影到与高斯核函数关联的RKHS中时,则两个样本投影后的点距…
- 试判断定义在上的函数是否为核函数。____(是/否)
- 试判断定义在上的函数是否为核函数。 ____(是/否)
- 对于支持向量机定义的超平面,下列说法错误的是 A通过支持向量机求解出的划分超平面是对训练样本…
- 关于支持向量机基本型中间隔、支持向量和超平面wx+b=0的说法,下列说法正确的是 A对于线性可分的…
神经网络
- 下列关于BP算法使用小步长优化神经网络的说法中正确的是哪个? A一定能学到最优解 B可以较好的避…
- 下列关于多层前馈神经网络的描述中错误的是哪个? A可以使用BP算法优化 B至少包含一个隐层 C神…
- 多层前馈神经网络可以视为线性函数与激活函数的复合,而单隐层前馈神经网络中这种复合的次数有限,因…
- 下列哪个选项的步长调整方法是给出的四种方案中最好的? A先使用较大的步长,后使用较小的步长 B先使…
- 下列关于万有逼近描述正确的是哪个选项? A万有逼近是神经网络独有的性质 B神经网络的万有逼近性…
- Sigmoid函数在 x=0.5 处的导数值为____(保留3位小数)。
- 具有10个隐层结点的单隐层网络在处理输入维度为6维的三分类任务时 (有3个输出层结点),网络中共有_…
- 实际应用中常使用试错法来设置隐层神经元数,当问题较复杂时,通常使用较____(多/少) 隐层神经元。…
- 考虑一个有1个输入结点、1个隐层结点、1个输出结点构成的神经网络,该网络输入到隐层的权重与隐层…
- 上述损失关于ω的偏导在初始点处的取值为____(保留3位小数)。
- 上述损失关于 b 的偏导在初始点处的取值为____ (保留3位有效数字)。
- 当步长取为0.5时,使用BP算法更新神经网络模型后,模型的损失为____ (保留3位小数)。…
- 当步长取为20时,使用BP算法更新神经网络模型后,模型的损失为____ (保留3位小数)。对比上述两种步长…
- 用学习率α=0.3 进行15次梯度下降迭代,每次迭代后计算损失。如果发现损失值下降缓慢,并且在15次迭…
- 下图是某一激活函数的图像,下列哪个选项可能是该激活函数的表达式?…
贝叶斯分类器
- 贝叶斯最优分类器____(达到了/没达到)了贝叶斯风险。
- 在贝叶斯决策论中,下列说法错误的是() A 反映了机器学习所能产生的模型精度理论上限 B 贝叶斯最…
- 从贝叶斯决策论的角度看,机器学习要实现的是基于有限的训练样本尽可能准确地估计出后验概率P(c|x)…
- 下列说法错误的是() A生成式模型可以理解为在尝试还原数据原来的联合分布 BSVM是判别式模型 C判…
- 贝叶斯主义一般做____(点/分布)估计
- 下列说法错误的是() A贝叶斯学习≠贝叶斯分类器 BSVM属于统计学习 C用到了贝叶斯公式就是贝叶斯…
- 下列说法错误的是() A极大似然估计做了独立同分布假设 B极大似然估计的任务是利用训练集估计参数…
- 极大似然估计中,对数似然的解与原问题____(一致/不一致)
- 下列说法错误的是() A计算 P(x|c) 主要障碍之一是组合爆炸 B计算 P(x|c) 主要障碍之一是样本稀疏…
- 考虑二分类问题,若数据集中有100个样本,其中负类样本有48个。令 c 表示正类,则 P(c) 的估计值是____…
- 考虑如图数据集,其中x1与x2为特征,其取值集合分别为x1={−1,0,1},x2={B,M,S},y为类别标记,其取值集…
- 考虑如图数据集,其中x1与x2为特征,其取值集合分别为x1={−1,0,1},x2={B,M,S},y为类别标记,其取值集…
- 考虑如图数据集,其中x1与x2为特征,其取值集合分别为x1={−1,0,1},x2={B,M,S},y为类别标记,其取值集…
- 以下哪个选项是生成式模型? A贝叶斯网 B对数几率回归 C决策树 D支持向量机…
- 最小化分类错误率的贝叶斯最优分类器为:对每个样本选择能使以下哪个选项最大的类别标记? A后验概…
集成学习和聚类
- 下列关于误差-分歧分解的说法中正确的是哪个? A这一分解表明特定条件下,集成学习的性能与个体学习…
- 下列关于同质集成学习与异质集成学习对比的说法中错误的是哪个? A异质集成学习能获得更多样的个…
- 下列基于两分类器的预测结果连列表定义的表达式中,你认为哪个不适合作为多样性度量?…
- 下列关于集成学习的说法中错误的是? A个体学习器准确率很高后,要增加多样性可以不牺牲准确性 B当…
- 多样性是集成学习的关键,现实任务中往往会在学习过程中引入随机性来增强个体学习器的多样性,你认为…
- AdaBoost算法是一种常用的Boosting算法,该算法的伪代码如图所示,其中Zt用于确保Dt+1是一个分布。考…
- 上题第2轮中,样本3的权重为____(保留3位小数)。
- 弱学习器指泛化性能略优于随机猜测的学习器,如二分类问题中指精度略高于0.5的分类器。那么在三分…
- 当样本足够多时,使用3个基学习器的Bagging算法用到的训练数据的比例为____(小数形式并保留3位小数…
- 随机森林是一种典型的Bagging算法。随机森林使用的决策树的每个结点,先从该结点的属性集合中随机…
- 随机森林与传统决策树构成的森林相比,多样性往往____(更高/相同/更低)。…
- 当我们想将无标记的数据分成若干簇时,应该选用下列什么类型的算法? A分类 B回归 C以上都可以 D…
- 下面哪一项是通过样本分布的紧密程度确定聚类结构的聚类算法? A原型聚类 B密度聚类 C层次聚类 …
- 下图所示聚类结构____(可以/不可以)通过标准型的k均值聚类算法得到。 注:标准型指不使用核方法。…
- 下图所示聚类结构最可能通过____(原型聚类/密度聚类/层次聚类)得到…