您可能感兴趣的问题
- 存储虚拟化是指将存储资源集中到一个大容量的资源池并实行单点统一管理,无需中断应用即可改变存储系统和数据迁移。()
- Hadoop1.0和Hadoop2.0区别包括()。 AHadoop2.0新增了HDFS HA机制 BHadoop2.0新增了HDFS federation CHadoop2.0新增了YARN框架 D
- 如果任务运行在它将处理的数据所在的节点, 则称该任务具有“数据本地性”。()
- 下列关于Spark使用场景描述正确的有()。 A复杂的海量数据批量处理,时间在数十分钟到数小时之间。 B基于历史数据的交互式查询,时间在数十秒到数十分钟之间。 C基于实时数据流的数据处理,时间在数百毫
- 若要在 HBase 上使用 SQL,则需要联合使用 Apache Phonenix,或者联合使用 Hive 和 HBase。
- 下列关于数据仓库工具Hive架构描述正确的是()。 AHive用户接口主要有三个:CLI,JDBC/ODBC和Web UI,最常用的是CLI。 BHive将元数据存储在关系型数据库中,有三种模式可连接
- HDFS的优点包括( )。 A 高容错性,适合批处理 B 构建在廉价机器上 C 适合大数据处理,流式文件访问 D 对延时要求在毫秒级别的应用
- 大数据的特点对通用大数据分析系统架构的显式需求()。 A 海量的计算 B 海量的存储 C 快速的计算 D 低成本
- Spark GraphX是Spark中用于图和图计算的组件。()
- 下列关于数据仓库工具Hive架构描述正确的是( )。 A HiveQL通过命令行或者客户端提交。 B 经过Compiler编译器,运用MetaStore中的元数据进行类型检测和语法分析,生成一个逻辑方