第一章测试
1. 回归和分类都是有监督学习问题。 ( )
参考答案:
对
2. 输出变量为有限个离散变量的预测问题是回归问题; 输出变量为连续变量的
预测问题是分类问题。 ( )
参考答案:
错
3. 关于“回归(Regression ) ”和“相关(Correlation ) ”, 下列说法正确的是?
注意:x 是自变量, y 是因变量。 ( )
参考答案:
回归在 x 和 y 之间是非对称的, 相关在 x 和 y 之间是互为对称的
4. 如果一个经过训练的机器学习模型在测试集上达到 100% 的准确率, 这就意
味着该模型将在另外一个新的测试集上也能得到 100% 的准确率。 ( )
参考答案:
错
5. 机器学习学得的模型适用于新样本的能力, 称为 泛化 能力, 这是针对分类
和回归等监督学习任务而言的, 与聚类这样的无监督学习任务无关。 ( )
参考答案:
错
6. 机器学习时, 我们通常假设样本空间中的全体样本都服从某个未知 分布 ,
并且我们获得的每个样本都是独立地从这个分布上采样获得的。( )
参考答案:
对
7. 从归纳偏好一般性原 ……此处隐藏12193个字…… 个参数的平方和的开方值
;L1 范数会使权值稀疏
2. 关于特征选择, 下列对 Ridge 回归和 Lasso 回归说法正确的是?( )
参考答案:
Lasso 回归适用于特征选择
3. 下列哪一种方法的系数没有闭式( closed-form ) 解? ( )
参考答案:
Lasso
4. 我们希望减少数据集中的特征数量。 你可以采取以下哪一个步骤来减少特征?
( )
参考答案:
使用正向选择法(Forward Selection )
;使用反向消除法(Backward Elimination )
;逐步选择消除法(Stepwise )
;计算不同特征之间的相关系数, 删去相关系数高的特征之一
5. 建立线性模型时, 我们看变量之间的相关性。 在寻找相关矩阵中的相关系数
时, 如果发现 3 对变量(Var1 和 Var2、 Var2 和 Var3、 Var3 和 Var1) 之间
的相关性分别为 -0. 98 、 0. 45 和 1.23。 我们能从中推断出什么呢? ( )
参考答案:
Var1 和 Var2 具有很高的相关性
;Var3 和 Var1 相关系数为 1. 23 是不可能的
;Var1 和 Var2 存在多重共线性, 模型可以去掉其中一个特征