问题:
[填空题]在没有“未来数据”的情况下,我们____(能/不能)通过训练集对泛化误差进行估计。
答案解析:
您可能感兴趣的问题
- 大数据的定义是()。 A指无法在可承受的时间范围内用常规软件工具进行捕捉.管理和处理的数据集合 B任何超过了一台计算机处理能力的数据量 C具有很大价值的数据 D超过个人PC机或笔记本硬盘存储容量的数据
- Hadoop MapReduce.Spark属于离线计算框架技术。()
- HDFS不支持多用户写入,也无法进行文件随机修改。仅支持以append的方式,即通过追加的方式添加到文件结尾处。()
- Spark是一种包含流处理能力的下一代批处理框架。主要应用在广告、报表、推荐系统等业务上。()
- 各行业海量的数据中,大约20%左右属于结构化的数据,80%的数据属于广泛存在于社交网络.物联网.电子商务等领域的非结构化数据。()
- 下列关于MapReduce2.0架构描述正确的有()。 AMapReduce 2.0将 JobTracker 两个主要的功能资源管理和任务调度/监控分离成单独的组件。 BMapReduce2.0架构包
- 下列关于Spark GraphX图计算描述正确的有()。 A图上的计算任务分成图并行计算和数据并行计算两种。 B图并行计算任务是指那些迭代计算任务,如PageRank。 C数据并行计算任务是指图上代数
- Storm是Twitter开源的分布式实时大数据处理框架,被业界称为实时版Hadoop。()
- 以下哪些是虚拟化需要解决的问题()。 A 隔离性 B 移动性 C 安全性 D 可配额/可度量
- 下列关于Spark Streaming描述正确的有( )。 A 是构建在Spark RDD之上的一款流处理工具。 B 是Spark核心(Spark Core)API的一个扩展。 C 可以实现高吞吐量的