15. Hadoop中，MapReduce处理流程的三大步骤不包括（）。A．MapB．ReduceC．SortD．Shuffle

题目

15. Hadoop中，MapReduce处理流程的三大步骤不包括（）。

A．Map

B．Reduce

C．Sort

D．Shuffle

相似考题

1.下面不属于Hadoop安装步骤的是()。A、安装JDK和配置Java环境变量B、设置免密码登录C、下载Eclipse集成开发环境D、修改Hadoop配置文件并启动Hadoop

2.大数据开发的两大核心技术是Hadoop和MapReduce。()此题为判断题(对，错)。

3.Hadoop中执行MapReduce任务不含哪种方式()。A.MahoutB.HadoopjarC.Shell脚本D.Python

4.企业物流运作流程设计的步骤中不包括实施流程再造。()

更多“15. Hadoop中，MapReduce处理流程的三大步骤不包括（）。”相关问题

第1题：

MapReduce处理流程的三大步骚不包括()

A、map
B、sort
C、shuffle
D、reduce

参考答案B
第2题：

MapReduce框架提供了一种序列化键／值对的方法,支持这种序列化的类能够在Map和Reduce过程中充当键或值,以下说法错误的是()

A.实现Writable接口的类是值
B.实现WritableComparable接口的类可以是值或键
C.Hadoop的基本类型Text并不实现WritableComparable接口
D.键和值的数据类型可以超出Hadoop自身支持的基本类型

正确答案：C
第3题：

Hadoop之父DougCutting曾曰Spark迟早会把mapreduce给取代，意味着hadoop已经走向没落，会被取代逐渐淘汰

正确答案:错误
第4题：

etl处理完成的数据可以存在以下哪些组件中（）
- A、hdfs
- B、hive
- C、hbase
- D、mapreduce
正确答案:A,B,C
第5题：

绘制系统流程图的主要根据不包括：（）
- A、信息处理的步骤和内容
- B、各步骤之间的物理和逻辑关系
- C、使用流程图常用符号的多少
- D、每一步所涉及的物理过程
正确答案:C
第6题：

在中水处理中，无论采用哪种处理流程，消毒灭菌的步骤及其保障性时必不可少的。

正确答案:正确
第7题：

问答题
Spark的出现是为了解决Hadoop MapReduce的不足，试列举Hadoop MapReduce的几个缺陷，并说明Spark具备哪些优点。

正确答案：（1）Hadoop存在以下缺点：
①表达能力有限；②磁盘IO开销大；③延迟高
（2）Spark主要有如下优点：
①Spark的计算模式也属于MapReduce，但不局限于Map和Reduce操作，还提供了多种数据集操作类型，编程模型比MapReduce更灵活；
②Spark提供了内存计算，中间结果直接存放内存中，带来更高的迭代运算效率；
③Spark基于DAG的任务调度执行机制，要优于MapReduce的迭代执行机制。
解析：暂无解析
第8题：

单选题
关于Hive和Hadoop其他组件的关系，以下描述错误的是？（）
A
Hive最终将数据存储在HDFS中
B
HiveSQL其本质是执行MapReduce任务
C
Hive是Hadoop平台的数据仓库工具
D
Hive对HBase有强依赖

正确答案： D
解析：暂无解析
第9题：

判断题
企业物流运作流程设计的步骤中不包括实施流程再造。
A
对
B
错

正确答案：对
解析：暂无解析
第10题：

判断题
Pig是一个基于Hadoop的大规模数据分析平台，它提供的SQL-LIKE语言叫PigLatin，该语言的编译器会把类SQL的数据分析请求转换为一系列经过优化处理的MapReduce运算。( )
A
对
B
错

正确答案：错
解析：
第11题：

单选题
下面不属于Hadoop安装步骤的是（）
A
安装JDK和配置Java环境变量
B
设置免密码登录
C
下载Eclipse集成开发环境
D
修改Hadoop配置文件并启动Hadoop

正确答案： A
解析：暂无解析
第12题：

单选题
Hadoop中MapReduce组件擅长处理哪种场景的计算任务？（）
A
迭代计算
B
离线计算
C
实时交互计算
D
流式计算

正确答案： C
解析：暂无解析
第13题：

Hadoop是Java开发的,所以MapReduce只支持Java语言编写。( )

此题为判断题(对，错)。

正确答案：错误
第14题：

在高阶数据处理中,往往无法把整个流程写在单个MapReduce作业中,下列关于链接MapReduce作业的说法,不正确的是()

A.Job和JobControl类可以管理非线性作业之间的依赖
B.ChainMapper和ChainReducer类可以用来简化数据预处理和后处理的构成
C.使用ChainReducer时，每个mapper和reducer对象都有一个本地JobConf对象
D.ChainReducer.addMapper()方法中，一般对键/值对发送设置成值传递，性能好且安全性高

正确答案：D
第15题：

与Hadoop的MapReduce相比，Spark基于内存的运算要快100倍以上，基于硬盘的运算也要快10倍以上

正确答案:正确
第16题：

hadoop中的mapreduce是基于什么运行的计算框架（）
- A、内存
- B、磁盘
- C、内存加磁盘
- D、网络
正确答案:B
第17题：

订货处理流程的步骤？

正确答案: 订货处理流程：
（1）订单准备
（2）订单传输
（3）订单录入
（4）订单状况报告
（5）定单履行
第18题：

问答题
请描述在YARN框架中执行一个MapReduce程序时，从提交到完成需要经历的具体步骤。

正确答案： ①用户编写客户端应用程序，向YARN提交应用程序，提交的内容包括ApplicationMaster程序、启动ApplicationMaster的命令、用户程序等。
②YARN中的ResourceManager负责接收和处理来自客户端的请求。接到客户端应用程序请求后，ResourceManager里面的调度器会为应用程序分配一个容器。同时，ResourceManager的应用程序管理器会与该容器所在的NodeManager通信，为该应用程序在该容器中启动一个ApplicationMaster。
③ApplicationMaster被创建后会首先向ResourceManager注册，从而使得用户可以通过ResourceManager来直接查看应用程序的运行状态。
④ApplicationMaster采用轮询的方式通过RPC协议向ResourceManager申请资源。
⑤ResourceManager以“容器”的形式向提出申请的ApplicationMaster分配资源，一旦ApplicationMaster申请到资源后，就会与该容器所在的NodeManager进行通信，要求它启动任务。
⑥当ApplicationMaster要求容器启动任务时，它会为任务设置好运行环境（包括环境变量、JAR包、二进制程序等），然后将任务启动命令写到一个脚本中，最后通过在容器中运行该脚本来启动任务。
⑦各个任务通过某个RPC协议向ApplicationMaster汇报自己的状态和进度，让ApplicationMaster可以随时掌握各个任务的运行状态，从而可以在任务失败时重启任务。
⑧应用程序运行完成后，ApplicationMaster向ResourceManager的应用程序管理器注销并关闭自己。若ApplicationMaster因故失败，ResourceManager中的应用程序管理器会监测到失败的情形，然后将其重新启动，直到所有任务执行完毕。
解析：暂无解析
第19题：

判断题
在中水处理中，无论采用哪种处理流程，消毒灭菌的步骤及其保障性时必不可少的。
A
对
B
错

正确答案：错
解析：暂无解析
第20题：

单选题
绘制系统流程图的主要根据不包括：（）
A
信息处理的步骤和内容
B
各步骤之间的物理和逻辑关系
C
使用流程图常用符号的多少
D
每一步所涉及的物理过程

正确答案： D
解析：暂无解析
第21题：

问答题
试述hadoop和谷歌的mapreduce、gfs等技术之间的关系

正确答案： Hadoop的核心是分布式文件系统HDFS和MapReduce，HDFS是谷歌文件系统GFS的开源实现，MapReduces是针对谷歌MapReduce的开源实现。
解析：暂无解析
第22题：

问答题
订货处理流程的步骤？

正确答案：订货处理流程：
（1）订单准备
（2）订单传输
（3）订单录入
（4）订单状况报告
（5）定单履行
解析：暂无解析
第23题：

问答题
试述MapReduce和Hadoop的关系。

正确答案：谷歌公司最先提出了分布式并行编程模型MapReduce， Hadoop MapReduce是它的开源实现。谷歌的MapReduce运行在分布式文件系统GFS上，与谷歌类似，HadoopMapReduce运行在分布式文件系统HDFS上。相对而言，HadoopMapReduce 要比谷歌MapReduce 的使用门槛低很多，程序员即使没有任何分布式程序开发经验，也可以很轻松地开发出分布式程序并部署到计算机集群中。
解析：暂无解析
第24题：

问答题
MapReduce 是处理大数据的有力工具，但不是每个任务都可以使用MapReduce 来进行处理。试述适合用MapReduce来处理的任务或者数据集需满足怎样的要求。

正确答案：适合用MapReduce来处理的数据集，需要满足一个前提条件：待处理的数据集可以分解成许多小的数据集，而且每一个小数据集都可以完全并行地进行处理。
解析：暂无解析

niusouti.com

15. Hadoop中，MapReduce处理流程的三大步骤不包括（）。A．MapB．ReduceC．SortD．Shuffle

题目

相似考题

更多“15. Hadoop中，MapReduce处理流程的三大步骤不包括（）。”相关问题

相关内容